De 5 feilene i data for kunstig intelligens

Mennesker er vant til å se data for hva det i mange tilfeller er: en mening. Faktisk, i noen tilfeller, forvrider folk data til det punktet hvor de blir ubrukelige, en misanning. En datamaskin eller AI-applikasjon kan ikke se forskjellen mellom sannferdig og usann data – alt den ser er data. En av problemene som gjør det vanskelig, om ikke umulig, å lage en kunstig intelligens som faktisk tenker som et menneske, er at mennesker kan jobbe med feil og datamaskiner ikke. Det beste du kan håpe å oppnå er å se feilaktige data som uteliggere og deretter filtrere dem ut, men den teknikken løser ikke nødvendigvis problemet fordi et menneske fortsatt vil bruke dataene og forsøke å fastslå en sannhet basert på missannhetene som er det.

En vanlig tanke om å lage mindre forurensede datasett er at i stedet for å la mennesker gå inn i dataene, bør det være mulig å samle inn dataene gjennom sensorer eller andre midler. Dessverre reflekterer sensorer og andre mekaniske inputmetodikker målene til deres menneskelige oppfinnere og grensene for hva den bestemte teknologien er i stand til å oppdage. Følgelig er til og med maskinavledet eller sensoravledet data også gjenstand for å generere feilsannheter som er ganske vanskelige for en AI å oppdage og overvinne.

Den følgende diskusjonen bruker en bilulykke som hovedeksempel for å illustrere fem typer feilsannheter som kan dukke opp i data. Konseptene som ulykken prøver å skildre kan ikke alltid vises i data, og de kan vises på andre måter enn diskutert. Faktum er at du vanligvis trenger å forholde deg til denne typen ting når du ser på data.

Mistruths of Commission

Mistruths of provisjon er de som reflekterer et direkte forsøk på å erstatte sann informasjon med usann informasjon. For eksempel, når de fyller ut en ulykkesrapport, kan noen si at solen et øyeblikk blendet dem, noe som gjør det umulig å se noen de treffer. I virkeligheten ble kanskje personen distrahert av noe annet eller faktisk ikke tenkte på å kjøre bil (muligens med tanke på en hyggelig middag). Hvis ingen kan motbevise denne teorien, kan personen klare seg med en mindre avgift. Men poenget er at dataene også vil bli forurenset. Effekten er at nå vil et forsikringsselskap basere premiene på feilaktige data.

Selv om det ser ut som om oppdragsmisannheter er fullstendig unngåelige, er de ofte ikke det. Mennesker forteller "små hvite løgner" for å spare andre for forlegenhet eller for å håndtere et problem med minst mulig egeninnsats. Noen ganger er en feilaktig kommisjon basert på feilaktige innspill eller hørersay. Faktisk er kildene for provisjonsfeil så mange at det virkelig er vanskelig å komme opp med et scenario der noen kan unngå dem helt. Alt dette er sagt, mistruths of commission er en type misruth som noen kan unngå oftere enn ikke.

Mistruths av utelatelse

Misforståelser om unnlatelse er de der en person forteller sannheten i hvert oppgitt faktum, men utelater et viktig faktum som ville endre oppfatningen av en hendelse som helhet. Tenker igjen på ulykkesrapporten, si at noen slår et rådyr og forårsaker betydelig skade på bilen deres. Han sier sannferdig at veien var våt; det var nær skumring, så lyset var ikke så godt som det kunne være; han var litt sen med å trykke på bremsen; og hjorten løp rett og slett ut fra et kratt ved siden av veien. Konklusjonen vil være at hendelsen rett og slett er en ulykke.

Personen har imidlertid utelatt et viktig faktum. Han sendte tekstmeldinger den gangen. Hvis politiet visste om tekstmeldingen, ville det endre årsaken til ulykken til uoppmerksom kjøring. Sjåføren kan bli bøtelagt og forsikringstilpasseren vil bruke en annen grunn når hendelsen legges inn i databasen. Som med misrenheten om provisjon, vil de resulterende feilaktige dataene endre hvordan forsikringsselskapet justerer premiene.

Å unngå feilsannheter om unnlatelse er nesten umulig. Ja, noen kunne med vilje utelatt fakta fra en rapport, men det er like sannsynlig at noen rett og slett glemmer å inkludere alle fakta. Tross alt er de fleste ganske skranglete etter en ulykke, så det er lett å miste fokus og bare rapportere de sannhetene som gjorde det mest betydningsfulle inntrykket. Selv om en person senere husker ytterligere detaljer og rapporterer dem, er det usannsynlig at databasen noen gang vil inneholde et komplett sett med sannheter.

Mistruths of Perspective

Perspektivfeil oppstår når flere parter ser på en hendelse fra flere utsiktspunkter. For eksempel, når man vurderer en ulykke som involverer en påkjørt fotgjenger, vil personen som kjører bilen, personen som ble truffet av bilen og en tilskuer som var vitne til hendelsen alle ha forskjellige perspektiver. En offiser som tar rapporter fra hver person vil forståelig nok få forskjellige fakta fra hver enkelt, selv forutsatt at hver person forteller sannheten slik hver kjenner den. Erfaring viser faktisk at dette nesten alltid er tilfellet, og det offiseren sender inn som rapport er midtveien i det hver av de involverte oppgir, forsterket med personlig erfaring. Med andre ord vil rapporten være nær sannheten, men ikke nær nok for en AI.

Når du arbeider med perspektiv, er det viktig å vurdere utsiktspunktet. Føreren av bilen kan se dashbordet og kjenner bilens tilstand på ulykkestidspunktet. Dette er informasjon som de to andre partiene mangler. Likeledes har den som blir påkjørt av bilen det beste utsiktspunktet for å se førerens ansiktsuttrykk (hensikt). Tilskueren kan være i den beste posisjonen til å se om sjåføren forsøkte å stoppe og vurdere problemer som om sjåføren prøvde å svinge. Hver part må lage en rapport basert på sett data uten å dra nytte av skjulte data.

Perspektivet er kanskje den farligste av misannhetene fordi alle som prøver å utlede sannheten i dette scenariet vil i beste fall ende opp med et gjennomsnitt av de ulike historiene, som aldri vil bli helt korrekte. Et menneske som ser på informasjonen kan stole på intuisjon og instinkt for potensielt å oppnå en bedre tilnærming til sannheten, men en AI vil alltid bruke bare gjennomsnittet, noe som betyr at AI alltid har en betydelig ulempe. Dessverre er det umulig å unngå perspektivmisannheter, for uansett hvor mange vitner du har til hendelsen, er det beste du kan håpe å oppnå en tilnærming av sannheten, ikke den faktiske sannheten.

Det er også en annen form for misannhet å vurdere, og det er perspektiv. Tenk på dette scenariet: Du er en døv person i 1927. Hver uke går du på kino for å se en stumfilm, og i en time eller mer føler du deg som alle andre. Du kan oppleve filmen på samme måte som alle andre gjør; det er ingen forskjeller. I oktober samme år ser du et skilt som sier at teatret oppgraderer for å støtte et lydsystem slik at det kan vise talkies— filmer med lydspor. Skiltet sier at det er den beste tingen noensinne, og nesten alle ser ut til å være enige, bortsett fra deg, den døve, som nå føles som en annenrangs borger, annerledes enn alle andre og til og med stort sett ekskludert fra teatret . I den døves øyne er det tegnet en misanning; å legge til et lydsystem er det verst mulige, ikke det best mulige. Poenget er at det som ser ut til å være generelt sant, faktisk ikke er sant for alle. Ideen om en generell sannhet - en som er sann for alle - er en myte. Det finnes ikke.

Mistruths of Bias

Fordommer oppstår når noen er i stand til å se sannheten, men på grunn av personlige bekymringer eller tro ikke er i stand til å faktisk se den. For eksempel, når han tenker på en ulykke, kan en sjåfør fokusere oppmerksomheten så fullstendig på midten av veien at hjorten i kanten av veien blir usynlig. Følgelig har sjåføren ikke tid til å reagere når hjorten plutselig bestemmer seg for å bolte seg ut midt på veien i et forsøk på å krysse.

Et problem med skjevhet er at det kan være utrolig vanskelig å kategorisere. For eksempel kan en sjåfør som ikke ser hjorten ha en reell ulykke, noe som betyr at hjorten ble skjult av buskas. Sjåføren kan imidlertid også gjøre seg skyldig i uoppmerksom kjøring på grunn av feil fokus. Sjåføren kan også oppleve en kortvarig distraksjon. Kort sagt, det faktum at sjåføren ikke så hjorten er ikke spørsmålet; i stedet handler det om hvorfor sjåføren ikke så hjorten. I mange tilfeller blir det viktig å bekrefte kilden til skjevhet når du oppretter en algoritme designet for å unngå en skjevhetskilde.

Teoretisk sett er det alltid mulig å unngå feilsannheter. I virkeligheten har imidlertid alle mennesker skjevheter av forskjellige typer, og disse skjevhetene vil alltid resultere i feilsannheter som forvrider datasettene. Bare det å få noen til å faktisk se og så se noe - å få det til å registrere seg i personens hjerne - er en vanskelig oppgave. Mennesker er avhengige av filtre for å unngå overbelastning av informasjon, og disse filtrene er også en kilde til skjevhet fordi de hindrer folk i å faktisk se ting.

Referanseramme

Av de fem missannhetene trenger ikke referanseramme faktisk være et resultat av noen form for feil, men en av forståelse. En ramme-of-reference misruth oppstår når en part beskriver noe, for eksempel en hendelse som en ulykke, og fordi en annen part mangler erfaring med hendelsen, blir detaljene rotete eller fullstendig misforstått. Komedierutiner florerer som er avhengige av referanserammefeil. Et kjent eksempel er fra Abbott og Costello, Who's On First? . Å få en person til å forstå hva en annen person sier kan være umulig når den første personen mangler erfaringskunnskap - referanserammen.

Et annet eksempel på en ramme-of-reference misruth oppstår når den ene parten umulig kan forstå den andre. For eksempel opplever en sjømann en storm på havet. Kanskje det er en monsun, men anta et øyeblikk at stormen er betydelig - kanskje livstruende. Selv med bruk av videoer, intervjuer og en simulator, ville opplevelsen av å være på havet i en livstruende storm være umulig å formidle til noen som ikke har opplevd en slik storm på første hånd; den personen har ingen referanseramme.

Den beste måten å unngå referanserammer på er å sikre at alle involverte parter kan utvikle lignende referanserammer. For å utføre denne oppgaven krever de ulike partene lignende erfaringskunnskap for å sikre nøyaktig overføring av data fra en person til en annen. Men når du arbeider med et datasett, som nødvendigvis er registrert, vil statiske data, referanserammefeil fortsatt oppstå når den potensielle seeren mangler den nødvendige erfaringskunnskapen.

En AI vil alltid oppleve problemer med referanseramme fordi en AI nødvendigvis mangler evnen til å skape en opplevelse. En databank med ervervet kunnskap er ikke helt det samme. Databanken vil inneholde fakta, men erfaring er ikke bare basert på fakta, men også konklusjoner som dagens teknologi ikke er i stand til å duplisere.


Snagit 2018 gjennomgang Hva er nytt siden versjon 13

Snagit 2018 gjennomgang Hva er nytt siden versjon 13

TechSmith Snagit er vår favorittprogramvare for skjermbilder og bilderedigering. Sjekk ut de nye funksjonene i Snagit 2018!

8 elektroniske verktøy for å tegne diagrammer og flytskjemaer

8 elektroniske verktøy for å tegne diagrammer og flytskjemaer

Trenger du å lage diagrammer eller flytskjemaer og ønsker ikke å installere ekstra programvare? Her er en liste over online diagramverktøy.

Kan ikke Spotify spille den gjeldende sangen? Hvordan fikse

Kan ikke Spotify spille den gjeldende sangen? Hvordan fikse

Å ha et hus fullt av trådløst tilkoblede enheter og strømmetjenester som Spotify er flott inntil ting ikke fungerer og du finner interessante løsninger.

Hva er en NVMe M.2 SSD og hvor rask er den?

Hva er en NVMe M.2 SSD og hvor rask er den?

NVMe M.2 SSD er det siste innen datamaskinharddiskteknologi. Hva er det og hvor raskt er det kontra eldre harddisker og Solid State Drives (SSD)?

Sonos vs. AirPlay: Hvorfor jeg valgte AirPlay for Whole House Audio

Sonos vs. AirPlay: Hvorfor jeg valgte AirPlay for Whole House Audio

Sonos er den beste streaming-lydløsningen som starter på $400 for to høyttalere. Men med riktig oppsett kan AirPlay være gratis. La oss se gjennom detaljene.

Google Backup and Sync App erstatter bilder og Disk

Google Backup and Sync App erstatter bilder og Disk

Google Backup and Sync er en ny app som synkroniserer til Bilder og Disk. Les videre for å se hvordan det står opp mot OneDrive, Dropbox, Backblaze og Crashplan.

Cord Cutting: Gjennomgang av MyIPTV med SOPlayer

Cord Cutting: Gjennomgang av MyIPTV med SOPlayer

MyIPTV er en kabelskjæringstjeneste som bruker SOPlayer-appen for flere plattformer og tilbyr TV, filmer og andre former for media for en betalt

Logitech Opplyst Living-Room Keyboard K830

Logitech Opplyst Living-Room Keyboard K830

Logitech ga nylig ut sitt Illuminated Living-Room Keyboard K830 som er ment som en hjemmeunderholdningskamerat. Her er vår anmeldelse av enheten.

CloudHQ Oppdatert: Raskere synkronisering, Rediger Dropbox-filer fra Google Docs

CloudHQ Oppdatert: Raskere synkronisering, Rediger Dropbox-filer fra Google Docs

Her er en titt på oppdateringen nylig utgitt til CloudHQ og hvordan den fungerer. Les videre for å finne mer.

Hva er OnePlus 6T Android-telefon?

Hva er OnePlus 6T Android-telefon?

OnePlus 6T er en førsteklasses flaggskipkvalitet Android-telefon som selges med rabatt sammenlignet med Apple iPhone, Google Pixel 3 eller Samsung Galaxy S9.