Les 5 falsedats de les dades per a la intel·ligència artificial

Els humans estem acostumats a veure les dades pel que són en molts casos: una opinió. De fet, en alguns casos, la gent esbiaixeix les dades fins al punt que esdevé inútil, una falsedat. Un ordinador o una aplicació d'IA no poden distingir entre dades veraces i falses: tot el que veu són dades. Un dels problemes que dificulten, si no impossible, crear una IA que en realitat pensi com un humà és que els humans poden treballar amb falsedats i els ordinadors no. El millor que podeu esperar d'aconseguir és veure les dades errades com a valors atípics i després filtrar-les, però aquesta tècnica no necessàriament resol el problema perquè un humà encara utilitzaria les dades i intentaria determinar una veritat basada en les falsedats que hi són.

Un pensament habitual sobre la creació de conjunts de dades menys contaminats és que en lloc de permetre que els humans ingressin les dades, hauria de ser possible recollir-les mitjançant sensors o altres mitjans. Malauradament, els sensors i altres metodologies d'entrada mecànica reflecteixen els objectius dels seus inventors humans i els límits del que la tecnologia en particular és capaç de detectar. En conseqüència, fins i tot les dades derivades de la màquina o dels sensors també estan subjectes a generar falsedats que són bastant difícils de detectar i superar per a una IA.

La discussió següent fa servir un accident de cotxe com a exemple principal per il·lustrar cinc tipus de falsedats que poden aparèixer a les dades. És possible que els conceptes que l'accident intenta representar no apareixen sempre a les dades i poden aparèixer de maneres diferents a les que s'han comentat. El fet és que normalment heu de fer front a aquest tipus de coses quan visualitzeu dades.

Falses de comissió

Les falsedats de comissió són aquelles que reflecteixen un intent rotund de substituir informació veraç per informació no veraç. Per exemple, en omplir un informe d'accident, algú podria afirmar que el sol els va encegar momentàniament, fent impossible veure algú a qui van colpejar. En realitat, potser la persona es va distreure per una altra cosa o en realitat no estava pensant en conduir (possiblement pensant en un bon sopar). Si ningú pot refutar aquesta teoria, la persona podria sortir amb un càrrec menor. Tanmateix, la qüestió és que les dades també estarien contaminades. L'efecte és que ara una companyia d'assegurances basaria les primes en dades errades.

Tot i que sembla que les falsedats de comissió són completament evitables, sovint no ho són. Els humans diuen "petites mentides blanques" per estalviar vergonya als altres o per tractar un problema amb el menor esforç personal. De vegades, la falsedat de la comissió es basa en aportacions errades o rumores. De fet, les fonts d'errors de comissió són tants que realment és difícil trobar un escenari en què algú els pugui evitar completament. Dit tot això, les falsedats de comissió són un tipus de falsedat que algú pot evitar la majoria de vegades.

Falses de l'omissió

Les falsedats d'omissió són aquelles en què una persona diu la veritat en cada fet afirmat però deixa de banda un fet important que canviaria la percepció d'un incident en el seu conjunt. Tornant a pensar en l'informe de l'accident, dir que algú colpeja un cérvol, causant danys importants al seu cotxe. Diu amb veritat que el camí estava humit; era a prop del crepuscle, així que la llum no era tan bona com podria ser; va arribar una mica tard a prémer el fre; i el cérvol simplement va sortir corrent d'un matoll al costat de la carretera. La conclusió seria que l'incident és simplement un accident.

Tanmateix, la persona ha deixat de banda un fet important. En aquell moment estava enviant missatges de text. Si les forces de l'ordre coneguessin els missatges de text, canviaria el motiu de l'accident per una conducció sense atenció. El conductor podria ser multat i l'ajustador de l'assegurança utilitzaria un motiu diferent per introduir l'incident a la base de dades. Igual que amb la falsedat de la comissió, les dades errades resultants canviarien la manera com la companyia d'assegurances ajusta les primes.

Evitar falsedats d'omissió és gairebé impossible. Sí, algú podria deixar deliberadament fets fora d'un informe, però és igual de probable que algú s'oblidi d'incloure tots els fets. Al cap i a la fi, la majoria de la gent està força desconcertada després d'un accident, de manera que és fàcil perdre el focus i informar només de les veritats que van deixar la impressió més significativa. Fins i tot si més tard una persona recorda detalls addicionals i els informa, és poc probable que la base de dades contingui mai un conjunt complet de veritats.

Falses de perspectiva

Les falsedats de perspectiva es produeixen quan diverses parts veuen un incident des de múltiples punts de vista. Per exemple, en considerar un accident en què un vianant atropellat, la persona que condueix el cotxe, la persona atropellada pel cotxe i un espectador que va presenciar l'esdeveniment tindrien perspectives diferents. Un oficial que prengués informes de cada persona obtindria, comprensiblement, fets diferents de cadascun, fins i tot assumint que cada persona digui la veritat tal com la coneix. De fet, l'experiència demostra que gairebé sempre és així i el que l'oficial presenta com a informe és el terme mitjà del que afirma cadascun dels implicats, augmentat per l'experiència personal. En altres paraules, l'informe estarà a prop de la veritat, però no prou per a una IA.

Quan es tracta de la perspectiva, és important tenir en compte el punt de vista. El conductor del cotxe pot veure el quadre de comandament i coneix l'estat del cotxe en el moment de l'accident. Aquesta és una informació de la qual els altres dos partits no tenen. Així mateix, la persona que és atropellada pel cotxe té el millor mirador per veure l'expressió facial (intenció) del conductor. El espectador podria estar en la millor posició per veure si el conductor va intentar aturar-se i avaluar problemes com ara si el conductor va intentar girar. Cada part haurà de fer un informe basat en dades vistes sense el benefici de dades ocultes.

La perspectiva és potser la més perillosa de les falsedats perquè qualsevol que intenti derivar la veritat en aquest escenari, en el millor dels casos, acabarà amb una mitjana de les diverses històries, que mai no serà del tot correcta. Un humà que visualitza la informació pot confiar en la intuïció i l'instint per obtenir una millor aproximació de la veritat, però una IA sempre utilitzarà només la mitjana, la qual cosa significa que la IA sempre es troba en un desavantatge important. Malauradament, evitar falsificacions de perspectiva és impossible perquè no importa quants testimonis tinguis de l'esdeveniment, el millor que pots esperar és una aproximació de la veritat, no la veritat real.

També hi ha un altre tipus de falsedat a tenir en compte, i és la perspectiva. Pensa en aquest escenari: ets una persona sorda l'any 1927. Cada setmana vas al teatre a veure una pel·lícula muda i durant una hora o més, et sents com tots els altres. Podeu experimentar la pel·lícula de la mateixa manera que ho fan tots els altres; no hi ha diferències. A l'octubre d'aquell any, veus un rètol que diu que el teatre s'està actualitzant per donar suport a un sistema de so perquè pugui mostrar vídeos parlants.— Pel·lícules amb banda sonora. El cartell diu que és el millor que s'ha fet mai, i gairebé tothom sembla estar d'acord, excepte tu, la persona sorda, que ara se'ls fa sentir com un ciutadà de segona, diferent de tots i fins i tot pràcticament exclòs del teatre. . Als ulls de la persona sorda, aquest signe és una falsedat; afegir un sistema de so és el pitjor possible, no el millor possible. La qüestió és que el que sembla ser generalment cert no ho és per a tothom. La idea d'una veritat general —una que sigui certa per a tothom— és un mite. No existeix.

Falses de biaix

Les falsedats de biaix es produeixen quan algú és capaç de veure la veritat, però a causa de preocupacions o creences personals és incapaç de veure-la realment. Per exemple, quan es pensa en un accident, un conductor pot centrar l'atenció tan completament al mig de la carretera que el cérvol a la vora de la carretera es torna invisible. En conseqüència, el conductor no té temps de reaccionar quan el cérvol decideix de sobte sortir al mig de la carretera per intentar creuar.

Un problema amb el biaix és que pot ser increïblement difícil de categoritzar. Per exemple, un conductor que no veu el cérvol pot tenir un accident genuí, és a dir, que el cérvol estava amagat a la vista pels arbustos. No obstant això, el conductor també pot ser culpable de conducció poc atenta a causa d'un enfocament incorrecte. El conductor també pot experimentar una distracció momentània. En definitiva, el fet que el conductor no hagi vist el cérvol no és la qüestió; en canvi, és una qüestió de per què el conductor no va veure el cérvol. En molts casos, confirmar la font de biaix esdevé important quan es crea un algorisme dissenyat per evitar una font de biaix.

Teòricament, sempre és possible evitar falsificacions. En realitat, però, tots els humans tenen biaixos de diversos tipus i aquests biaixos sempre donaran lloc a falsedats que esbiaixin els conjunts de dades. Només aconseguir que algú miri i després vegi alguna cosa, que es registri al cervell de la persona, és una tasca difícil. Els humans confien en els filtres per evitar la sobrecàrrega d'informació, i aquests filtres també són una font de biaix perquè impedeixen que la gent vegi realment les coses.

Marc de referència

De les cinc falsedats, el marc de referència no ha de ser el resultat de cap tipus d'error, sinó de comprensió. Una falsedat del marc de referència es produeix quan una part descriu alguna cosa, com ara un esdeveniment com un accident, i com que una segona part no té experiència amb l'esdeveniment, els detalls es confonen o s'entenen completament malament. Abunden les rutines de comèdia que es basen en errors de marc de referència. Un exemple famós és d'Abbott i Costello, Who's On First? . Aconseguir que una persona entengui el que diu una segona persona pot ser impossible quan la primera persona no té coneixements de l'experiència: el marc de referència.

Un altre exemple de falsedat del marc de referència es produeix quan una part no pot entendre l'altra. Per exemple, un mariner experimenta una tempesta al mar. Potser és un monsó, però suposa per un moment que la tempesta és substancial, potser la vida. Fins i tot amb l'ús de vídeos, entrevistes i un simulador, l'experiència d'estar al mar en una tempesta que posa en perill la vida seria impossible de transmetre a algú que no hagi viscut una tempesta com aquesta de primera mà; aquesta persona no té cap marc de referència.

La millor manera d'evitar les falsedats dels marcs de referència és assegurar-se que totes les parts implicades puguin desenvolupar marcs de referència similars. Per dur a terme aquesta tasca, les diferents parts requereixen coneixements d'experiència similars per garantir la transferència precisa de dades d'una persona a una altra. Tanmateix, quan es treballa amb un conjunt de dades, que necessàriament s'enregistra, dades estàtiques, errors de marc de referència encara es produiran quan l'espectador potencial no tingui els coneixements experimentals necessaris.

Una IA sempre experimentarà problemes de marc de referència perquè una IA necessàriament no té la capacitat de crear una experiència. Un banc de dades de coneixements adquirits no és exactament el mateix. El banc de dades contindria fets, però l'experiència es basa no només en fets, sinó també en conclusions que la tecnologia actual no és capaç de duplicar.

Per a gent gran: com inserir imatges predissenyades en una diapositiva de PowerPoint

Les imatges predissenyades són obres d'art genèriques dibuixades prèviament i Microsoft ofereix molts fitxers d'imatges d'imatges de manera gratuïta amb els seus productes d'Office. Podeu inserir imatges predissenyades al disseny de la diapositiva de PowerPoint. La manera més senzilla d'inserir imatges predissenyades és utilitzant un dels marcadors de posició en un disseny de diapositives: Mostra una diapositiva que conté una imatge prediseñada […]

Per a gent gran: Com omplir el color a Microsoft Excel

El color de farciment, també anomenat ombrejat, és el color o el patró que omple el fons d'una o més cel·les del full de treball d'Excel. L'aplicació d'ombrejat pot ajudar els ulls del lector a seguir la informació a través d'una pàgina i pot afegir color i interès visual a un full de treball. En alguns tipus de fulls de càlcul, com ara un registre de xecs, […]

Afegeix nous contactes en Act! 2005

En el nivell més senzill, l'objectiu principal d'ACT! és servir com a lloc per emmagatzemar tots els contactes amb els quals interactueu diàriament. Podeu afegir i editar tots els vostres contactes des de la finestra Detall del contacte perquè conté tota la informació relacionada amb un registre en particular i […]

Full de trucs de Discord per a LuckyTemplates

Utilitzeu aquest full de trucs per començar directament a utilitzar Discord. Descobriu útils bots de Discord, aplicacions que podeu integrar i consells per entrevistar convidats.

Full de trucs dOpenOffice.org per a LuckyTemplates

La suite ofimàtica OpenOffice.org té moltes eines per facilitar la vida laboral. Quan treballeu a l'OpenOffice.org, coneixeu la barra d'eines de funcions (que sembla gairebé igual a totes les aplicacions) i els botons de la barra d'eines principal per obtenir ajuda amb les ordres bàsiques per a la majoria de tasques.

Bombe Machine dAlan Turing

La màquina Bombe d'Alan Turing no era cap forma d'intel·ligència artificial (IA). De fet, ni tan sols és un ordinador real. Va trencar els missatges criptogràfics d'Enigma, i això és tot. No obstant això, va proporcionar elements per pensar a Turing, que finalment va donar lloc a un article titulat â€œComputing Machinery and Intelligenceâ€?? que va publicar a la dècada de 1950 que descriu […]

Deficiències de maquinari estàndard per a la intel·ligència artificial

La capacitat de crear un sistema modular té avantatges importants, especialment en els negocis. La capacitat d'eliminar i substituir components individuals manté els costos baixos alhora que permet millores incrementals tant en velocitat com en eficiència. Tanmateix, com passa amb la majoria de coses, no hi ha dinar gratuït. La modularitat que ofereix l'arquitectura Von Neumann ve amb algunes […]

10 coses a fer i a fer en utilitzar QuarkXPress

Si haguéssiu de triar deu coses fàcils d'oblidar però extremadament útils per recordar sobre QuarkXPress, les de la llista següent, estimat lector, serien elles. Namaste. Parleu amb la vostra impressora comercial Tots els projectes d'impressió comencen i acaben amb la impressora. Això és perquè només els impressors coneixen les seves limitacions i les milers de maneres en què un projecte pot ser […]

Lorigen de Bitcoin

L'aspecte més important de bitcoin pot ser el concepte que hi ha darrere. Bitcoin va ser creat pel desenvolupador Satoshi Nakamoto. En lloc d'intentar dissenyar un mètode de pagament completament nou per enderrocar la forma en què tots paguem les coses en línia, Satoshi va veure certs problemes amb els sistemes de pagament existents i va voler solucionar-los. El concepte de […]

Com protegir la vostra privadesa quan feu servir Bitcoin

Un cert nivell d'anonimat està lligat a l'ús de bitcoins i moneda digital en general. Si pots etiquetar-ho com a "prou anònim" és una opinió personal. Hi ha maneres de protegir la vostra privadesa quan feu servir bitcoins per moure fons, però aquestes requereixen un cert esforç i planificació: podeu generar una nova adreça per a […]