Com tracta la intel·ligència artificial amb les dades que falten

Per respondre correctament una pregunta determinada, has de tenir tots els fets. Podeu endevinar la resposta a una pregunta sense tots els fets, però llavors és tan probable que la resposta sigui incorrecta com correcta. Sovint, es diu que algú que pren una decisió, bàsicament responent a una pregunta, sense tots els fets, arriba a una conclusió. Quan analitzeu les dades, probablement heu arribat a més conclusions del que penseu a causa de les dades que falten. Un registre de dades, una entrada en un conjunt de dades (que són totes les dades), consta de camps que contenen fets utilitzats per respondre una pregunta. Cada camp conté un únic tipus de dades que aborden un sol fet. Si aquest camp està buit, no teniu les dades que necessiteu per respondre la pregunta utilitzant aquest registre de dades concret.

Com a part del procés de tractament de les dades que falten, heu de saber que les dades falten. Identificar que falta informació al vostre conjunt de dades pot ser bastant difícil perquè requereix que mireu les dades a un nivell baix, una cosa que la majoria de la gent no està preparada per fer i requereix molt de temps, fins i tot si teniu les habilitats necessàries. Sovint, la vostra primera pista que falten dades són les respostes absurdes que obtenen les vostres preguntes de l'algorisme i el conjunt de dades associat. Quan l'algorisme és l'adequat per utilitzar, el conjunt de dades ha de tenir la culpa.

Es pot produir un problema quan el procés de recollida de dades no inclou totes les dades necessàries per respondre una pregunta concreta. De vegades, és millor abandonar un fet en lloc d'utilitzar un fet considerablement danyat. Si trobeu que a un camp concret d'un conjunt de dades li falten el 90% o més de les seves dades, el camp esdevé inútil i l'heu d'eliminar del conjunt de dades (o trobar alguna manera d'obtenir totes aquestes dades).

Els camps menys danyats poden tenir dades que falten de dues maneres. Les dades que falten aleatòriament són sovint el resultat d'un error humà o del sensor. Es produeix quan els registres de dades de tot el conjunt de dades tenen entrades que falten. De vegades, un simple error causarà el dany. Les dades que falten seqüencialment es produeixen durant algun tipus d'error generalitzat. Un segment sencer dels registres de dades del conjunt de dades no té la informació necessària, la qual cosa significa que l'anàlisi resultant pot arribar a ser força esbiaixada.

El més fàcil és arreglar les dades que falten aleatòriament. Podeu utilitzar una mitjana simple o un valor mitjà com a reemplaçament. No, el conjunt de dades no és completament precís, però probablement funcionarà prou bé per obtenir una resposta raonable. En alguns casos, els científics de dades van utilitzar un algorisme especial per calcular el valor que faltava, cosa que pot fer que el conjunt de dades sigui més precís a costa del temps computacional.

Les dades que falten seqüencialment són molt més difícils, si no impossibles, d'arreglar perquè no teniu cap dada circumdant en la qual basar qualsevol tipus de conjectura. Si podeu trobar la causa de les dades que falten, de vegades la podeu reconstruir. Tanmateix, quan la reconstrucció es fa impossible, podeu optar per ignorar el camp. Malauradament, algunes respostes requeriran aquest camp, la qual cosa significa que potser haureu d'ignorar aquesta seqüència particular de registres de dades, cosa que podria provocar una sortida incorrecta.


Per a gent gran: com inserir imatges predissenyades en una diapositiva de PowerPoint

Per a gent gran: com inserir imatges predissenyades en una diapositiva de PowerPoint

Les imatges predissenyades són obres d'art genèriques dibuixades prèviament i Microsoft ofereix molts fitxers d'imatges d'imatges de manera gratuïta amb els seus productes d'Office. Podeu inserir imatges predissenyades al disseny de la diapositiva de PowerPoint. La manera més senzilla d'inserir imatges predissenyades és utilitzant un dels marcadors de posició en un disseny de diapositives: Mostra una diapositiva que conté una imatge prediseñada […]

Per a gent gran: Com omplir el color a Microsoft Excel

Per a gent gran: Com omplir el color a Microsoft Excel

El color de farciment, també anomenat ombrejat, és el color o el patró que omple el fons d'una o més cel·les del full de treball d'Excel. L'aplicació d'ombrejat pot ajudar els ulls del lector a seguir la informació a través d'una pàgina i pot afegir color i interès visual a un full de treball. En alguns tipus de fulls de càlcul, com ara un registre de xecs, […]

Afegeix nous contactes en Act! 2005

Afegeix nous contactes en Act! 2005

En el nivell més senzill, l'objectiu principal d'ACT! és servir com a lloc per emmagatzemar tots els contactes amb els quals interactueu diàriament. Podeu afegir i editar tots els vostres contactes des de la finestra Detall del contacte perquè conté tota la informació relacionada amb un registre en particular i […]

Full de trucs de Discord per a LuckyTemplates

Full de trucs de Discord per a LuckyTemplates

Utilitzeu aquest full de trucs per començar directament a utilitzar Discord. Descobriu útils bots de Discord, aplicacions que podeu integrar i consells per entrevistar convidats.

Full de trucs dOpenOffice.org per a LuckyTemplates

Full de trucs dOpenOffice.org per a LuckyTemplates

La suite ofimàtica OpenOffice.org té moltes eines per facilitar la vida laboral. Quan treballeu a l'OpenOffice.org, coneixeu la barra d'eines de funcions (que sembla gairebé igual a totes les aplicacions) i els botons de la barra d'eines principal per obtenir ajuda amb les ordres bàsiques per a la majoria de tasques.

Bombe Machine dAlan Turing

Bombe Machine dAlan Turing

La màquina Bombe d'Alan Turing no era cap forma d'intel·ligència artificial (IA). De fet, ni tan sols és un ordinador real. Va trencar els missatges criptogràfics d'Enigma, i això és tot. No obstant això, va proporcionar elements per pensar a Turing, que finalment va donar lloc a un article titulat “Computing Machinery and Intelligenceâ€?? que va publicar a la dècada de 1950 que descriu […]

Deficiències de maquinari estàndard per a la intel·ligència artificial

Deficiències de maquinari estàndard per a la intel·ligència artificial

La capacitat de crear un sistema modular té avantatges importants, especialment en els negocis. La capacitat d'eliminar i substituir components individuals manté els costos baixos alhora que permet millores incrementals tant en velocitat com en eficiència. Tanmateix, com passa amb la majoria de coses, no hi ha dinar gratuït. La modularitat que ofereix l'arquitectura Von Neumann ve amb algunes […]

10 coses a fer i a fer en utilitzar QuarkXPress

10 coses a fer i a fer en utilitzar QuarkXPress

Si haguéssiu de triar deu coses fàcils d'oblidar però extremadament útils per recordar sobre QuarkXPress, les de la llista següent, estimat lector, serien elles. Namaste. Parleu amb la vostra impressora comercial Tots els projectes d'impressió comencen i acaben amb la impressora. Això és perquè només els impressors coneixen les seves limitacions i les milers de maneres en què un projecte pot ser […]

Lorigen de Bitcoin

Lorigen de Bitcoin

L'aspecte més important de bitcoin pot ser el concepte que hi ha darrere. Bitcoin va ser creat pel desenvolupador Satoshi Nakamoto. En lloc d'intentar dissenyar un mètode de pagament completament nou per enderrocar la forma en què tots paguem les coses en línia, Satoshi va veure certs problemes amb els sistemes de pagament existents i va voler solucionar-los. El concepte de […]

Com protegir la vostra privadesa quan feu servir Bitcoin

Com protegir la vostra privadesa quan feu servir Bitcoin

Un cert nivell d'anonimat està lligat a l'ús de bitcoins i moneda digital en general. Si pots etiquetar-ho com a "prou anònim" és una opinió personal. Hi ha maneres de protegir la vostra privadesa quan feu servir bitcoins per moure fons, però aquestes requereixen un cert esforç i planificació: podeu generar una nova adreça per a […]