De 5 misforståelser i data til kunstig intelligens

Mennesker er vant til at se data for, hvad det i mange tilfælde er: en mening. Faktisk skævvrider folk i nogle tilfælde data til det punkt, hvor de bliver ubrugelige, en misandhed. En computer eller AI-applikation kan ikke kende forskel på sandfærdige og usandfærdige data - det eneste, den ser, er data. Et af de problemer, der gør det svært, hvis ikke umuligt, at skabe en AI, der rent faktisk tænker som et menneske, er, at mennesker kan arbejde med misandheder, og computere kan ikke. Det bedste, du kan håbe på at opnå, er at se de fejlagtige data som outliers og derefter filtrere dem fra, men den teknik løser ikke nødvendigvis problemet, fordi et menneske stadig ville bruge dataene og forsøge at bestemme en sandhed baseret på de misandheder, der er der.

En almindelig tanke om at skabe mindre forurenede datasæt er, at i stedet for at tillade mennesker at indtaste dataene, burde det være muligt at indsamle dataene gennem sensorer eller andre midler. Desværre afspejler sensorer og andre mekaniske inputmetoder målene for deres menneskelige opfindere og grænserne for, hvad den særlige teknologi er i stand til at opdage. Følgelig er selv maskinafledte eller sensorafledte data også genstand for at generere misandheder, som er ret svære for en AI at opdage og overvinde.

Den følgende diskussion bruger en bilulykke som hovedeksempel til at illustrere fem typer af misandheder, der kan optræde i data. De begreber, som ulykken forsøger at skildre, optræder muligvis ikke altid i data, og de kan optræde på andre måder end diskuteret. Faktum er, at du normalt skal håndtere den slags ting, når du ser data.

Mistruths of Commission

Mistruths of commission er dem, der afspejler et direkte forsøg på at erstatte sand information med usand information. For eksempel kan nogen, når de udfylder en ulykkesrapport, oplyse, at solen et øjeblik blændede dem, hvilket gjorde det umuligt at se en, de ramte. I virkeligheden var personen måske distraheret af noget andet eller tænkte faktisk ikke på at køre bil (muligvis overvejede en god middag). Hvis ingen kan modbevise denne teori, kan personen klare sig med en mindre afgift. Men pointen er, at dataene også ville blive forurenet. Effekten er, at et forsikringsselskab nu vil basere præmier på fejlagtige data.

Selvom det ser ud som om, at misligholdelse af kommission er fuldstændig undgåelige, er de det ofte ikke. Mennesker fortæller "små hvide løgne" for at spare andre for forlegenhed eller for at håndtere et problem med mindst mulig personlig indsats. Nogle gange er en mistro af kommission baseret på vildfarne input eller rygter. Faktisk er kilderne til kommissionsfejl så mange, at det virkelig er svært at komme med et scenarie, hvor nogen helt kan undgå dem. Alt dette sagt, er misandhed af kommission en type misandhed, som nogen kan undgå oftere end ikke.

Mistruths af undladelse

Misforståelser om udeladelse er dem, hvor en person fortæller sandheden i hvert erklæret faktum, men udelader et vigtigt faktum, der ville ændre opfattelsen af ​​en hændelse som helhed. Tænk igen på ulykkesrapporten, og sig, at nogen slår et rådyr og forårsager betydelig skade på deres bil. Han siger sandfærdigt, at vejen var våd; det var nær tusmørket, så lyset var ikke så godt, som det kunne være; han var lidt sen med at trykke på bremsen; og hjorten løb simpelthen ud fra et krat ved siden af ​​vejen. Konklusionen ville være, at hændelsen blot er en ulykke.

Personen har dog udeladt et vigtigt faktum. Han skrev en sms på det tidspunkt. Hvis ordensmagten vidste om sms'en, ville det ændre årsagen til ulykken til uopmærksom kørsel. Chaufføren kan blive idømt en bøde, og forsikringstilpasseren ville bruge en anden årsag, når han indtastede hændelsen i databasen. Som med mistroen af ​​provision, ville de resulterende fejlagtige data ændre, hvordan forsikringsselskabet justerer præmier.

Det er næsten umuligt at undgå misforståelser om undladelse. Ja, nogen kunne med vilje udelade fakta i en rapport, men det er lige så sandsynligt, at nogen simpelthen glemmer at inkludere alle fakta. De fleste mennesker er trods alt ret raslede efter en ulykke, så det er nemt at miste fokus og kun rapportere de sandheder, der efterlod det mest markante indtryk. Selvom en person senere husker yderligere detaljer og rapporterer dem, er det usandsynligt, at databasen nogensinde vil indeholde et komplet sæt af sandheder.

Perspektivets mistro

Perspektivmistråde opstår, når flere parter ser en hændelse fra flere udsigtspunkter. For eksempel, når man overvejer en ulykke, der involverer en påkørt fodgænger, vil den person, der kører bilen, den person, der bliver ramt af bilen, og en tilskuer, der overværede begivenheden, alle have forskellige perspektiver. En officer, der tager rapporter fra hver person, vil forståeligt nok få forskellige fakta fra hver enkelt, selv hvis man antager, at hver person fortæller sandheden, som hver kender den. Faktisk viser erfaringen, at dette næsten altid er tilfældet, og det, betjenten indsender som en rapport, er mellemvejen for, hvad hver af de involverede angiver, forstærket af personlige erfaringer. Med andre ord vil rapporten være tæt på sandheden, men ikke tæt nok til en AI.

Når man beskæftiger sig med perspektiv, er det vigtigt at overveje udsigtspunktet. Føreren af ​​bilen kan se instrumentbrættet og kender bilens tilstand på ulykkestidspunktet. Det er information, som de to andre parter mangler. Ligeledes har den, der bliver ramt af bilen, det bedste udsigtspunkt til at se førerens ansigtsudtryk (hensigt). Den omkringstående er måske i den bedste position til at se, om chaufføren gjorde et forsøg på at stoppe og vurdere spørgsmål, såsom om chaufføren forsøgte at svinge. Hver part bliver nødt til at lave en rapport baseret på set data uden fordele ved skjulte data.

Perspektiv er måske den farligste af misandheden, fordi enhver, der forsøger at udlede sandheden i dette scenarie, i bedste fald vil ende med et gennemsnit af de forskellige historier, som aldrig vil være helt korrekte. Et menneske, der ser informationen, kan stole på intuition og instinkt for potentielt at opnå en bedre tilnærmelse af sandheden, men en AI vil altid kun bruge gennemsnittet, hvilket betyder, at AI'en altid er i en betydelig ulempe. Desværre er det umuligt at undgå perspektivfejl, fordi uanset hvor mange vidner du har til begivenheden, er det bedste du kan håbe på at opnå en tilnærmelse af sandheden, ikke den faktiske sandhed.

Der er også en anden form for misandhed at overveje, og det er perspektiv. Tænk over dette scenarie: Du er en døv person i 1927. Hver uge går du i teatret for at se en stumfilm, og i en time eller mere føler du dig som alle andre. Du kan opleve filmen på samme måde som alle andre gør; der er ingen forskelle. I oktober samme år ser du et skilt, der siger, at teatret er ved at opgradere til at understøtte et lydsystem, så det kan vise talkies— film med et lydspor. Skiltet siger, at det er det bedste nogensinde, og næsten alle er tilsyneladende enige, undtagen dig, den døve, som nu føles som en andenrangsborger, anderledes end alle andre og endda stort set udelukket fra teatret . I den døves øjne er det tegn en misandhed; tilføjelse af et lydsystem er det værst tænkelige, ikke det bedst mulige. Pointen er, at det, der synes at være generelt sandt, faktisk ikke er sandt for alle. Ideen om en generel sandhed - en der er sand for alle - er en myte. Det findes ikke.

Mistruths of Bias

Mistruths of bias opstår, når nogen er i stand til at se sandheden, men på grund af personlige bekymringer eller overbevisninger ikke er i stand til rent faktisk at se den. For eksempel, når man tænker på en ulykke, kan en bilist fokusere opmærksomheden så fuldstændigt på midten af ​​vejen, at hjorten i kanten af ​​vejen bliver usynlig. Følgelig har føreren ikke tid til at reagere, da hjorten pludselig beslutter sig for at bolte sig ud på midten af ​​vejen i et forsøg på at krydse.

Et problem med bias er, at det kan være utroligt svært at kategorisere. For eksempel kan en bilist, der ikke ser hjorten, have en ægte ulykke, hvilket betyder, at hjorten blev skjult af buskads. Men føreren kan også være skyldig i uopmærksom kørsel på grund af forkert fokus. Føreren kan også opleve en kortvarig distraktion. Kort sagt, det faktum, at chaufføren ikke så hjorten, er ikke spørgsmålet; i stedet handler det om, hvorfor chaufføren ikke så hjorten. I mange tilfælde bliver det vigtigt at bekræfte kilden til bias, når der oprettes en algoritme designet til at undgå en bias-kilde.

Teoretisk set er det altid muligt at undgå misforståelser. I virkeligheden har alle mennesker imidlertid skævheder af forskellige typer, og disse skævheder vil altid resultere i misandheder, der skæver datasæt. Bare det at få nogen til rent faktisk at kigge og så se noget - at få det registreret i personens hjerne - er en vanskelig opgave. Mennesker er afhængige af filtre for at undgå overbelastning af information, og disse filtre er også en kilde til skævhed, fordi de forhindrer folk i faktisk at se ting.

Referenceramme

Af de fem misandheder behøver referenceramme faktisk ikke at være resultatet af nogen form for fejl, men en af ​​forståelse. En referencerammemisandhed opstår, når en part beskriver noget, såsom en begivenhed som en ulykke, og fordi en anden part mangler erfaring med begivenheden, bliver detaljerne forvirrede eller fuldstændig misforståede. Der er masser af komedierutiner, der er afhængige af referencerammefejl. Et berømt eksempel er fra Abbott og Costello, Who's On First? . At få én person til at forstå, hvad en anden person siger, kan være umuligt, når den første person mangler erfaringsmæssig viden - referencerammen.

Et andet eksempel på en referenceramme på misandhed opstår, når den ene part umuligt kan forstå den anden. For eksempel oplever en sømand en storm på havet. Måske er det en monsun, men antag et øjeblik, at stormen er betydelig - måske livstruende. Selv med brugen af ​​videoer, interviews og en simulator ville oplevelsen af ​​at være på havet i en livstruende storm være umulig at formidle til nogen, der ikke har oplevet sådan en storm på egen hånd; denne person har ingen referenceramme.

Den bedste måde at undgå referencerammemisandheder på er at sikre, at alle involverede parter kan udvikle lignende referencerammer. For at udføre denne opgave kræver de forskellige parter lignende erfaringsmæssig viden for at sikre nøjagtig overførsel af data fra én person til en anden. Men når der arbejdes med et datasæt, som nødvendigvis er optaget, vil statiske data, referencerammefejl stadig forekomme, når den potentielle seer mangler den nødvendige erfaringsmæssige viden.

En AI vil altid opleve ramme-of-reference-problemer, fordi en AI nødvendigvis mangler evnen til at skabe en oplevelse. En databank med erhvervet viden er ikke helt det samme. Databanken ville indeholde fakta, men erfaringerne er ikke kun baseret på fakta, men også konklusioner, som den nuværende teknologi ikke er i stand til at kopiere.


Snagit 2018 anmeldelse Hvad er nyt siden version 13

Snagit 2018 anmeldelse Hvad er nyt siden version 13

TechSmith Snagit er vores foretrukne screenshot- og billedredigeringssoftware. Tjek de nye funktioner i Snagit 2018!

8 onlineværktøjer til at tegne diagrammer og rutediagrammer

8 onlineværktøjer til at tegne diagrammer og rutediagrammer

Har du brug for at oprette diagrammer eller rutediagrammer og vil du ikke installere ekstra software? Her er en liste over online diagramværktøjer.

Kan Spotify ikke afspille den aktuelle sang? Sådan rettes

Kan Spotify ikke afspille den aktuelle sang? Sådan rettes

At have et hus fyldt med trådløst tilsluttede enheder og streamingtjenester som Spotify er fantastisk, indtil tingene ikke fungerer, og du finder interessante løsninger.

Hvad er en NVMe M.2 SSD, og ​​hvor hurtig er den?

Hvad er en NVMe M.2 SSD, og ​​hvor hurtig er den?

NVMe M.2 SSD er det seneste inden for computerharddiskteknologi. Hvad er det, og hvor hurtigt er det i forhold til ældre harddiske og Solid State Drives (SSD)?

Sonos vs. AirPlay: Hvorfor jeg valgte AirPlay til Whole House Audio

Sonos vs. AirPlay: Hvorfor jeg valgte AirPlay til Whole House Audio

Sonos er den perfekte streaming-lydløsning, der starter ved $400 for to højttalere. Men med den rigtige opsætning kan AirPlay være gratis. Lad os gennemgå detaljerne.

Google Backup and Sync App erstatter Fotos og Drev

Google Backup and Sync App erstatter Fotos og Drev

Google Backup and Sync er en ny app, der synkroniserer til Fotos og Drev. Læs videre for at se, hvordan det klarer sig i forhold til OneDrive, Dropbox, Backblaze og Crashplan.

Ledningsskæring: Gennemgang af MyIPTV med SOPlayer

Ledningsskæring: Gennemgang af MyIPTV med SOPlayer

MyIPTV er en kabelskæringstjeneste, der bruger SOPlayer-appen til flere platforme og leverer tv, film og andre former for medier til en betalt betaling

Logitech Oplyst Living-Room Keyboard K830

Logitech Oplyst Living-Room Keyboard K830

Logitech udgav for nylig sit Illuminated Living-Room Keyboard K830, der er tænkt som en hjemmeunderholdnings-ledsager. Her er vores anmeldelse af enheden.

CloudHQ Opdateret: Hurtigere synkronisering, Rediger Dropbox-filer fra Google Docs

CloudHQ Opdateret: Hurtigere synkronisering, Rediger Dropbox-filer fra Google Docs

Her er et kig på opdateringen, der for nylig blev udgivet til CloudHQ, og hvordan den fungerer. Læs videre for at finde mere.

Hvad er OnePlus 6T Android-telefonen?

Hvad er OnePlus 6T Android-telefonen?

OnePlus 6T er en førsteklasses flagskibskvalitet Android-telefon, som sælges med rabat i forhold til Apple iPhone, Google Pixel 3 eller Samsung Galaxy S9.