Els humans estem acostumats a veure les dades pel que són en molts casos: una opinió. De fet, en alguns casos, la gent esbiaixeix les dades fins al punt que esdevé inútil, una falsedat. Un ordinador o una aplicació d'IA no poden distingir entre dades veraces i falses: tot el que veu són dades. Un dels problemes que dificulten, si no impossible, crear una IA que en realitat pensi com un humà és que els humans poden treballar amb falsedats i els ordinadors no. El millor que podeu esperar d'aconseguir és veure les dades errades com a valors atípics i després filtrar-les, però aquesta tècnica no necessàriament resol el problema perquè un humà encara utilitzaria les dades i intentaria determinar una veritat basada en les falsedats que hi són.
Un pensament habitual sobre la creació de conjunts de dades menys contaminats és que en lloc de permetre que els humans ingressin les dades, hauria de ser possible recollir-les mitjançant sensors o altres mitjans. Malauradament, els sensors i altres metodologies d'entrada mecànica reflecteixen els objectius dels seus inventors humans i els límits del que la tecnologia en particular és capaç de detectar. En conseqüència, fins i tot les dades derivades de la màquina o dels sensors també estan subjectes a generar falsedats que són bastant difícils de detectar i superar per a una IA.
La discussió següent fa servir un accident de cotxe com a exemple principal per il·lustrar cinc tipus de falsedats que poden aparèixer a les dades. És possible que els conceptes que l'accident intenta representar no apareixen sempre a les dades i poden aparèixer de maneres diferents a les que s'han comentat. El fet és que normalment heu de fer front a aquest tipus de coses quan visualitzeu dades.
Falses de comissió
Les falsedats de comissió són aquelles que reflecteixen un intent rotund de substituir informació veraç per informació no veraç. Per exemple, en omplir un informe d'accident, algú podria afirmar que el sol els va encegar momentàniament, fent impossible veure algú a qui van colpejar. En realitat, potser la persona es va distreure per una altra cosa o en realitat no estava pensant en conduir (possiblement pensant en un bon sopar). Si ningú pot refutar aquesta teoria, la persona podria sortir amb un càrrec menor. Tanmateix, la qüestió és que les dades també estarien contaminades. L'efecte és que ara una companyia d'assegurances basaria les primes en dades errades.
Tot i que sembla que les falsedats de comissió són completament evitables, sovint no ho són. Els humans diuen "petites mentides blanques" per estalviar vergonya als altres o per tractar un problema amb el menor esforç personal. De vegades, la falsedat de la comissió es basa en aportacions errades o rumores. De fet, les fonts d'errors de comissió són tants que realment és difícil trobar un escenari en què algú els pugui evitar completament. Dit tot això, les falsedats de comissió són un tipus de falsedat que algú pot evitar la majoria de vegades.
Falses de l'omissió
Les falsedats d'omissió són aquelles en què una persona diu la veritat en cada fet afirmat però deixa de banda un fet important que canviaria la percepció d'un incident en el seu conjunt. Tornant a pensar en l'informe de l'accident, dir que algú colpeja un cérvol, causant danys importants al seu cotxe. Diu amb veritat que el camí estava humit; era a prop del crepuscle, així que la llum no era tan bona com podria ser; va arribar una mica tard a prémer el fre; i el cérvol simplement va sortir corrent d'un matoll al costat de la carretera. La conclusió seria que l'incident és simplement un accident.
Tanmateix, la persona ha deixat de banda un fet important. En aquell moment estava enviant missatges de text. Si les forces de l'ordre coneguessin els missatges de text, canviaria el motiu de l'accident per una conducció sense atenció. El conductor podria ser multat i l'ajustador de l'assegurança utilitzaria un motiu diferent per introduir l'incident a la base de dades. Igual que amb la falsedat de la comissió, les dades errades resultants canviarien la manera com la companyia d'assegurances ajusta les primes.
Evitar falsedats d'omissió és gairebé impossible. Sí, algú podria deixar deliberadament fets fora d'un informe, però és igual de probable que algú s'oblidi d'incloure tots els fets. Al cap i a la fi, la majoria de la gent està força desconcertada després d'un accident, de manera que és fàcil perdre el focus i informar només de les veritats que van deixar la impressió més significativa. Fins i tot si més tard una persona recorda detalls addicionals i els informa, és poc probable que la base de dades contingui mai un conjunt complet de veritats.
Falses de perspectiva
Les falsedats de perspectiva es produeixen quan diverses parts veuen un incident des de múltiples punts de vista. Per exemple, en considerar un accident en què un vianant atropellat, la persona que condueix el cotxe, la persona atropellada pel cotxe i un espectador que va presenciar l'esdeveniment tindrien perspectives diferents. Un oficial que prengués informes de cada persona obtindria, comprensiblement, fets diferents de cadascun, fins i tot assumint que cada persona digui la veritat tal com la coneix. De fet, l'experiència demostra que gairebé sempre és així i el que l'oficial presenta com a informe és el terme mitjà del que afirma cadascun dels implicats, augmentat per l'experiència personal. En altres paraules, l'informe estarà a prop de la veritat, però no prou per a una IA.
Quan es tracta de la perspectiva, és important tenir en compte el punt de vista. El conductor del cotxe pot veure el quadre de comandament i coneix l'estat del cotxe en el moment de l'accident. Aquesta és una informació de la qual els altres dos partits no tenen. Així mateix, la persona que és atropellada pel cotxe té el millor mirador per veure l'expressió facial (intenció) del conductor. El espectador podria estar en la millor posició per veure si el conductor va intentar aturar-se i avaluar problemes com ara si el conductor va intentar girar. Cada part haurà de fer un informe basat en dades vistes sense el benefici de dades ocultes.
La perspectiva és potser la més perillosa de les falsedats perquè qualsevol que intenti derivar la veritat en aquest escenari, en el millor dels casos, acabarà amb una mitjana de les diverses històries, que mai no serà del tot correcta. Un humà que visualitza la informació pot confiar en la intuïció i l'instint per obtenir una millor aproximació de la veritat, però una IA sempre utilitzarà només la mitjana, la qual cosa significa que la IA sempre es troba en un desavantatge important. Malauradament, evitar falsificacions de perspectiva és impossible perquè no importa quants testimonis tinguis de l'esdeveniment, el millor que pots esperar és una aproximació de la veritat, no la veritat real.
També hi ha un altre tipus de falsedat a tenir en compte, i és la perspectiva. Pensa en aquest escenari: ets una persona sorda l'any 1927. Cada setmana vas al teatre a veure una pel·lícula muda i durant una hora o més, et sents com tots els altres. Podeu experimentar la pel·lícula de la mateixa manera que ho fan tots els altres; no hi ha diferències. A l'octubre d'aquell any, veus un rètol que diu que el teatre s'està actualitzant per donar suport a un sistema de so perquè pugui mostrar vídeos parlants.— Pel·lícules amb banda sonora. El cartell diu que és el millor que s'ha fet mai, i gairebé tothom sembla estar d'acord, excepte tu, la persona sorda, que ara se'ls fa sentir com un ciutadà de segona, diferent de tots i fins i tot pràcticament exclòs del teatre. . Als ulls de la persona sorda, aquest signe és una falsedat; afegir un sistema de so és el pitjor possible, no el millor possible. La qüestió és que el que sembla ser generalment cert no ho és per a tothom. La idea d'una veritat general —una que sigui certa per a tothom— és un mite. No existeix.
Falses de biaix
Les falsedats de biaix es produeixen quan algú és capaç de veure la veritat, però a causa de preocupacions o creences personals és incapaç de veure-la realment. Per exemple, quan es pensa en un accident, un conductor pot centrar l'atenció tan completament al mig de la carretera que el cérvol a la vora de la carretera es torna invisible. En conseqüència, el conductor no té temps de reaccionar quan el cérvol decideix de sobte sortir al mig de la carretera per intentar creuar.
Un problema amb el biaix és que pot ser increïblement difícil de categoritzar. Per exemple, un conductor que no veu el cérvol pot tenir un accident genuí, és a dir, que el cérvol estava amagat a la vista pels arbustos. No obstant això, el conductor també pot ser culpable de conducció poc atenta a causa d'un enfocament incorrecte. El conductor també pot experimentar una distracció momentània. En definitiva, el fet que el conductor no hagi vist el cérvol no és la qüestió; en canvi, és una qüestió de per què el conductor no va veure el cérvol. En molts casos, confirmar la font de biaix esdevé important quan es crea un algorisme dissenyat per evitar una font de biaix.
Teòricament, sempre és possible evitar falsificacions. En realitat, però, tots els humans tenen biaixos de diversos tipus i aquests biaixos sempre donaran lloc a falsedats que esbiaixin els conjunts de dades. Només aconseguir que algú miri i després vegi alguna cosa, que es registri al cervell de la persona, és una tasca difícil. Els humans confien en els filtres per evitar la sobrecàrrega d'informació, i aquests filtres també són una font de biaix perquè impedeixen que la gent vegi realment les coses.
Marc de referència
De les cinc falsedats, el marc de referència no ha de ser el resultat de cap tipus d'error, sinó de comprensió. Una falsedat del marc de referència es produeix quan una part descriu alguna cosa, com ara un esdeveniment com un accident, i com que una segona part no té experiència amb l'esdeveniment, els detalls es confonen o s'entenen completament malament. Abunden les rutines de comèdia que es basen en errors de marc de referència. Un exemple famós és d'Abbott i Costello, Who's On First? . Aconseguir que una persona entengui el que diu una segona persona pot ser impossible quan la primera persona no té coneixements de l'experiència: el marc de referència.
Un altre exemple de falsedat del marc de referència es produeix quan una part no pot entendre l'altra. Per exemple, un mariner experimenta una tempesta al mar. Potser és un monsó, però suposa per un moment que la tempesta és substancial, potser la vida. Fins i tot amb l'ús de vídeos, entrevistes i un simulador, l'experiència d'estar al mar en una tempesta que posa en perill la vida seria impossible de transmetre a algú que no hagi viscut una tempesta com aquesta de primera mà; aquesta persona no té cap marc de referència.
La millor manera d'evitar les falsedats dels marcs de referència és assegurar-se que totes les parts implicades puguin desenvolupar marcs de referència similars. Per dur a terme aquesta tasca, les diferents parts requereixen coneixements d'experiència similars per garantir la transferència precisa de dades d'una persona a una altra. Tanmateix, quan es treballa amb un conjunt de dades, que necessàriament s'enregistra, dades estàtiques, errors de marc de referència encara es produiran quan l'espectador potencial no tingui els coneixements experimentals necessaris.
Una IA sempre experimentarà problemes de marc de referència perquè una IA necessàriament no té la capacitat de crear una experiència. Un banc de dades de coneixements adquirits no és exactament el mateix. El banc de dades contindria fets, però l'experiència es basa no només en fets, sinó també en conclusions que la tecnologia actual no és capaç de duplicar.