Ljudje smo v mnogih primerih navajeni videti podatke takšne, kot so: mnenje. Pravzaprav v nekaterih primerih ljudje izkrivljajo podatke do te mere, da postanejo neuporabni, kar je napačna resnica. Računalnik ali aplikacija za umetno inteligenco ne more razlikovati med resničnimi in neresničnimi podatki – vidijo le podatki. Ena od težav, zaradi katerih je težko, če ne celo nemogoče, ustvariti umetno inteligenco, ki dejansko razmišlja kot človek, je ta, da ljudje lahko delajo z napačnimi resnicami, računalniki pa ne. Najboljše, kar lahko pričakujete, je, da napačne podatke vidite kot izstopajoče in jih nato filtrirate, vendar ta tehnika nujno ne reši težave, ker bi človek še vedno uporabljal podatke in poskušal ugotoviti resnico na podlagi napačnih dejstev. so tam.
Pogosta misel o ustvarjanju manj onesnaženih podatkovnih nizov je, da bi namesto da bi ljudem omogočili vnos podatkov, bi moralo biti možno zbiranje podatkov prek senzorjev ali drugih sredstev. Na žalost senzorji in druge mehanske metodologije vnosa odražajo cilje njihovih človeških izumiteljev in meje tega, kar je določena tehnologija sposobna zaznati. Posledično so tudi podatki, pridobljeni s stroji ali senzorji, prav tako podvrženi ustvarjanju neresnic, ki jih AI zelo težko zazna in premaga.
Naslednja razprava uporablja prometno nesrečo kot glavni primer za ponazoritev petih vrst neresnic, ki se lahko pojavijo v podatkih. Koncepti, ki jih poskuša prikazati nesreča, se morda ne pojavljajo vedno v podatkih in se lahko pojavijo na različne načine, kot so razpravljali. Dejstvo ostaja, da se morate pri ogledu podatkov običajno ukvarjati s tovrstnimi stvarmi.
Napačne informacije o komisiji
Napačne informacije o naročilu so tiste, ki odražajo odkrit poskus zamenjave resničnih informacij z neresničnimi. Na primer, ko je izpolnjeval poročilo o nesreči, bi lahko nekdo izjavil, da ga je sonce za trenutek oslepilo, zaradi česar ni bilo mogoče videti nekoga, ki ga je udaril. V resnici je morda osebo motilo nekaj drugega ali pa dejansko ni razmišljal o vožnji (morda glede na prijetno večerjo). Če te teorije nihče ne more ovreči, se lahko oseba spopade z nižjo ceno. Bistvo pa je, da bi bili tudi podatki kontaminirani. Posledica je, da bi zdaj zavarovalnica temeljila premije na napačnih podatkih.
Čeprav se zdi, kot da se napačni zavesti o proviziji popolnoma izognemo, pogosto niso. Človek govori "majhne bele laži", da drugim prihrani zadrego ali da se spopade s težavo z najmanj osebnega truda. Včasih napačna resnica o proviziji temelji na napačnih prispevkih ali govoricah. Pravzaprav je virov za napake pri naročilu toliko, da je res težko izmisliti scenarij, kjer bi se jim lahko nekdo v celoti izognil. Vse to pove, da so napačne zavesti o proviziji ena od vrst neresnice, ki se ji nekdo lahko izogne pogosteje kot ne.
Zmote o opustitvi
Zmota o opustitvi so tiste, pri katerih oseba pove resnico v vsakem navedenem dejstvu, vendar izpusti pomembno dejstvo, ki bi spremenilo dojemanje incidenta kot celote. Če ponovno pomislite na poročilo o nesreči, povejte, da nekdo udari jelena in povzroči znatno škodo na njegovem avtomobilu. Resnično pravi, da je bila cesta mokra; bil je blizu mraka, tako da svetloba ni bila tako dobra, kot bi lahko bila; malce je zamudil s pritiskom na zavoro; in jelen je preprosto stekel iz goščave ob cesti. Zaključek bi bil, da je incident preprosto nesreča.
Vendar pa je oseba izpustila pomembno dejstvo. Takrat je pošiljal sporočila. Če bi organi pregona vedeli za pošiljanje sporočil, bi to spremenilo razlog za nesrečo v nepazljivo vožnjo. Voznik bi lahko bil kaznovan, zavarovalnica pa bi pri vnosu incidenta v bazo podatkov uporabila drugačen razlog. Tako kot pri napačni vrednosti provizije bi posledično napačni podatki spremenili način, kako zavarovalnica prilagaja premije.
Izogibati se napačni zavesti o opustitvi je skoraj nemogoče. Da, nekdo bi lahko namenoma izpustil dejstva iz poročila, vendar je prav tako verjetno, da bo nekdo preprosto pozabil vključiti vsa dejstva. Navsezadnje je večina ljudi po nesreči precej razburjena, zato je enostavno izgubiti fokus in poročati le o tistih resnicah, ki so pustile najpomembnejši vtis. Tudi če si oseba pozneje zapomni dodatne podrobnosti in jih poroča, je malo verjetno, da bo baza podatkov vsebovala celoten nabor resnic.
Napačna perspektiva
Napačna perspektiva se pojavi, ko več strank na incident gleda z več vidikov. Na primer, če upoštevamo nesrečo, v kateri je bil zadet pešec, oseba, ki je vozila avto, oseba, ki jo je zadel avto, in mimoidoči, ki je bil priča dogodku, bi imeli vsi različne perspektive. Policist, ki jemlje poročila od vsake osebe, bi razumljivo od vsakega dobil različna dejstva, tudi če bi predpostavili, da vsaka oseba govori resnico, kot jo vsak pozna. Pravzaprav izkušnje kažejo, da je tako skoraj vedno in kar uradnik predloži kot poročilo, je sredina tega, kar navaja vsak od vpletenih, dopolnjen z osebnimi izkušnjami. Z drugimi besedami, poročilo bo blizu resnici, vendar ne dovolj blizu za AI.
Ko se ukvarjate s perspektivo, je pomembno upoštevati izhodiščno točko. Voznik avtomobila lahko vidi armaturno ploščo in pozna stanje avtomobila v času nesreče. To so podatki, ki jih drugi dve stranki nimata. Prav tako ima oseba, ki jo zadene avto, najboljšo izhodišče, da vidi voznikov izraz obraza (namera). Navzoči opazovalec je morda v najboljšem položaju, da vidi, ali se je voznik poskušal ustaviti, in oceni težave, kot je, ali je voznik poskušal zaviti. Vsaka stranka bo morala pripraviti poročilo na podlagi videnih podatkov brez koristi skritih podatkov.
Perspektiva je morda najnevarnejša med napačnimi resnicami, ker bo vsak, ki bo poskušal izpeljati resnico v tem scenariju, v najboljšem primeru končal s povprečjem različnih zgodb, ki nikoli ne bodo popolnoma pravilne. Človek, ki gleda informacije, se lahko zanese na intuicijo in instinkt, da bi lahko dosegel boljši približek resnice, vendar bo AI vedno uporabila le povprečje, kar pomeni, da je AI vedno v precej slabšem položaju. Žal se je izogniti napačni perspektivi nemogoče, ker ne glede na to, koliko prič imate dogodka, je najboljše, kar lahko upate, da dosežete, približek resnici, ne dejanski resnici.
Obstaja tudi druga vrsta neresnice, ki jo je treba upoštevati, in to je perspektiva. Pomislite na ta scenarij: leta 1927 ste gluha oseba. Vsak teden greste v gledališče gledat nemi film in se uro ali več počutite kot vsi drugi. Film lahko doživite na enak način kot vsi drugi; ni razlik. Oktobra istega leta vidite napis, ki pravi, da se gledališče nadgrajuje, da bo podpiralo zvočni sistem, tako da lahko prikazuje zvočnike— filmi z zvočnim posnetkom. Napis pravi, da je to nekaj najboljšega doslej, in zdi se, da se skoraj vsi strinjajo, razen tebe, gluhe osebe, ki si se zdaj počutil kot drugorazredni državljan, drugačen od vseh drugih in celo precej izključen iz gledališča . V očeh gluhe osebe je to znamenje neresnica; dodajanje ozvočenja je najslabša možna stvar, ne najboljša možna stvar. Bistvo je, da to, kar se zdi na splošno res, dejansko ne drži za vse. Ideja o splošni resnici – tisti, ki velja za vse – je mit. Ne obstaja.
Zmote o pristranskosti
Napačna resnica o pristranskosti se pojavi, ko je nekdo sposoben videti resnico, vendar je zaradi osebnih pomislekov ali prepričanj ne more dejansko videti. Na primer, ko razmišlja o nesreči, bi voznik lahko tako popolnoma osredotočil pozornost na sredino ceste, da jelenjad na robu ceste postane neviden. Posledično se voznik nima časa odzvati, ko se jelen nenadoma odloči, da bo skočil na sredino ceste in poskušal prečkati.
Težava s pristranskostjo je, da jo je lahko neverjetno težko kategorizirati. Na primer, voznik, ki ne vidi jelena, lahko doživi resnično nesrečo, kar pomeni, da je bil jelen pred pogledom skrito z grmovjem. Lahko pa je voznik kriv tudi za nepazljivo vožnjo zaradi napačnega fokusa. Voznik lahko doživi tudi trenutno motnjo. Skratka, to, da voznik ni videl jelena, ni vprašanje; namesto tega gre za to, zakaj voznik ni videl jelena. V mnogih primerih postane potrditev vira pristranskosti pomembna pri ustvarjanju algoritma, ki je zasnovan tako, da se izogne viru pristranskosti.
Teoretično se je vedno mogoče izogniti napačnim resnicam o pristranskosti. V resnici pa imajo vsi ljudje različne vrste pristranskosti in te pristranskosti bodo vedno povzročile napačne resnice, ki izkrivljajo nabore podatkov. Samo pridobiti nekoga, da dejansko pogleda in nato nekaj vidi – da se to registrira v možganih osebe – je težka naloga. Ljudje se zanašajo na filtre, da se izognejo preobremenitvi z informacijami, ti filtri pa so tudi vir pristranskosti, ker ljudem preprečujejo, da bi dejansko videli stvari.
Referenčni okvir
Od petih zmot ni nujno, da je referenčni okvir dejansko rezultat kakršne koli napake, temveč razumevanje. Napačna resnica v referenčnem okviru se pojavi, ko ena stranka nekaj opiše, na primer dogodek, kot je nesreča, in ker druga stran nima izkušenj z dogodkom, postanejo podrobnosti zmedene ali popolnoma napačno razumljene. V komediji je veliko rutin, ki se zanašajo na napake referenčnega okvira. Eden od znanih primerov je iz knjige Abbott in Costello, Kdo je prvi? . Nemogoče je pridobiti eno osebo, da razume, kaj pravi druga oseba, če prva oseba nima izkustvenega znanja – referenčnega okvira.
Še en primer napačne resnice referenčnega okvira se pojavi, ko ena stran nikakor ne more razumeti druge. Na primer, mornar doživi nevihto na morju. Morda je monsun, vendar za trenutek predpostavimo, da je nevihta velika - morda smrtno nevarna. Tudi z uporabo videoposnetkov, intervjujev in simulatorja bi izkušnjo bivanja na morju v življenjsko nevarni nevihti nemogoče prenesti nekomu, ki takšnega neurja še ni doživel iz prve roke; ta oseba nima referenčnega okvira.
Najboljši način, da se izognete napačnim resnicam glede referenčnega okvira, je zagotoviti, da lahko vse vpletene strani razvijejo podobne referenčne okvire. Za izpolnitev te naloge različne strani potrebujejo podobno izkustveno znanje, da zagotovijo natančen prenos podatkov od ene osebe do druge. Vendar pa se pri delu z naborom podatkov, ki je nujno zabeležen, statični podatki, napake referenčnega okvirja še vedno pojavljajo, ko bodoči gledalec nima zahtevanega izkustvenega znanja.
Umetna inteligenca bo vedno imela težave z referenčnim okvirjem, ker AI nujno nima sposobnosti za ustvarjanje izkušnje. Banka podatkov pridobljenega znanja ni čisto ista stvar. Baza podatkov bi vsebovala dejstva, vendar izkušnje ne temeljijo samo na dejstvih, ampak tudi na sklepih, ki jih trenutna tehnologija ni sposobna podvojiti.