Ako sa umelá inteligencia vysporiadava s chýbajúcimi údajmi

Aby ste správne odpovedali na danú otázku, musíte poznať všetky fakty. Môžete uhádnuť odpoveď na otázku bez všetkých faktov, ale potom je odpoveď rovnako pravdepodobne nesprávna ako správna. Často sa hovorí, že niekto, kto sa rozhodne, v podstate odpovie na otázku, bez všetkých faktov, urobí unáhlený záver. Pri analýze údajov ste pravdepodobne kvôli chýbajúcim údajom urobili viac záverov, ako si myslíte. Záznam dát, jedna položka v dátovom súbore (čo je všetky dáta), sa skladá z polí , ktoré obsahujú skutočnosti použiť na odpovedať na otázku. Každé pole obsahuje jeden druh údajov, ktoré sa týkajú jednej skutočnosti. Ak je toto pole prázdne, nemáte údaje, ktoré potrebujete na zodpovedanie otázky pomocou konkrétneho údajového záznamu.

V rámci procesu riešenia chýbajúcich údajov musíte vedieť, že údaje chýbajú. Identifikovať, že vo vašom súbore údajov chýbajú informácie, môže byť v skutočnosti dosť ťažké, pretože vyžaduje, aby ste sa na údaje pozerali na nízkej úrovni – niečo, na čo väčšina ľudí nie je pripravená a je to časovo náročné, aj keď máte požadované zručnosti. Často sú vaším prvým vodítkom, že chýbajú údaje, absurdné odpovede, ktoré vaše otázky získavajú z algoritmu a súvisiaceho súboru údajov. Keď je algoritmus správny na použitie, chyba musí byť v súbore údajov.

Problém môže nastať, keď proces zberu údajov nezahŕňa všetky údaje potrebné na zodpovedanie konkrétnej otázky. Niekedy je lepšie fakt vypustiť, ako použiť značne poškodený fakt. Ak zistíte, že určitému poľu v množine údajov chýba 90 alebo viac percent údajov, pole sa stane neužitočným a musíte ho z množiny údajov odstrániť (alebo nájsť nejaký spôsob, ako získať všetky tieto údaje).

V menej poškodených poliach môžu chýbať údaje jedným z dvoch spôsobov. Náhodne chýbajúce údaje sú často výsledkom ľudskej chyby alebo chyby senzora. Vyskytuje sa vtedy, keď v dátových záznamoch v celej množine údajov chýbajú položky. Niekedy spôsobí škodu aj obyčajná chyba. Postupne chýbajúce údaje sa vyskytujú počas určitého typu všeobecného zlyhania. Celému segmentu dátových záznamov v dátovom súbore chýbajú požadované informácie, čo znamená, že výsledná analýza môže byť značne skreslená.

Oprava náhodne chýbajúcich údajov je najjednoduchšia. Ako náhradu môžete použiť jednoduchý medián alebo priemernú hodnotu. Nie, súbor údajov nie je úplne presný, ale pravdepodobne bude fungovať dostatočne dobre na získanie rozumnej odpovede. V niektorých prípadoch vedci údajov použili špeciálny algoritmus na výpočet chýbajúcej hodnoty, čo môže spresniť súbor údajov na úkor výpočtového času.

Postupne chýbajúce údaje je podstatne ťažšie, ak nie nemožné, opraviť, pretože vám chýbajú akékoľvek okolité údaje, na ktorých by ste mohli založiť akýkoľvek druh odhadu. Ak nájdete príčinu chýbajúcich údajov, môžete ich niekedy zrekonštruovať. Keď sa však rekonštrukcia stane nemožnou, môžete sa rozhodnúť pole ignorovať. Bohužiaľ, niektoré odpovede budú vyžadovať toto pole, čo znamená, že možno budete musieť ignorovať túto konkrétnu sekvenciu dátových záznamov, čo môže spôsobiť nesprávny výstup.

Leave a Comment

Ako nájsť a pripojiť sa k skupine Google Groups

Ako nájsť a pripojiť sa k skupine Google Groups

Zistite, ako nájsť a/alebo ako sa pripojiť ku skupine v aplikácii Skupiny Google. Môžete sa pripojiť priamo ku skupine, požiadať o pripojenie ku skupine alebo o pozvánku.

Ako naplánovať budúce stretnutie zoom

Ako naplánovať budúce stretnutie zoom

Zistite, ako naplánovať schôdzu Zoom a ako zabezpečiť registráciu účastníkov. Učte sa, ako môžete prispôsobiť schôdze a využiť funkcie prieskumov.

Textové skratky InDesign CS5

Textové skratky InDesign CS5

Objavte efektívne textové skratky v InDesign CS5, ktoré vám pomôžu formátovať a usporiadať text pomocou klávesových príkazov.

Ako vytvoriť odkaz na počítačový súbor alebo priečinok

Ako vytvoriť odkaz na počítačový súbor alebo priečinok

Skrátky na pracovnej ploche umožňujú rýchly prístup k súborom a programom. Prečítajte si viac o tom, ako ich vytvoriť a spravovať.

Pre seniorov: Ako vložiť klipart do snímky programu PowerPoint

Pre seniorov: Ako vložiť klipart do snímky programu PowerPoint

Klipart je predkreslená generická kresba a spoločnosť Microsoft poskytuje veľa súborov klipartov zadarmo so svojimi produktmi Office. Do rozloženia snímky programu PowerPoint môžete vložiť klipart. Najjednoduchší spôsob vloženia klipartov je pomocou jedného zo zástupných symbolov na rozložení snímky: Zobrazte snímku, ktorá obsahuje klipart […]

Pre seniorov: Ako vyplniť farbu v programe Microsoft Excel

Pre seniorov: Ako vyplniť farbu v programe Microsoft Excel

Farba výplne – tiež nazývaná tieňovanie – je farba alebo vzor, ​​ktorý vypĺňa pozadie jednej alebo viacerých buniek hárka programu Excel. Použitie tieňovania môže pomôcť očiam čitateľa sledovať informácie na stránke a môže pridať farbu a vizuálny záujem do pracovného hárka. V niektorých typoch tabuliek, ako je register šekových knižiek, […]

Pridávanie nových kontaktov do služby Act! 2005

Pridávanie nových kontaktov do služby Act! 2005

Na úplne najjednoduchšej úrovni je hlavným účelom ACT! má slúžiť ako miesto na uloženie všetkých kontaktov, s ktorými denne komunikujete. Všetky svoje kontakty môžete pridávať a upravovať z okna Podrobnosti kontaktu, pretože obsahuje všetky informácie, ktoré sa týkajú jedného konkrétneho záznamu a […]

Discord For LuckyTemplates Cheat Sheet

Discord For LuckyTemplates Cheat Sheet

Použite tento Cheat Sheet na skok priamo do používania Discordu. Objavte užitočné roboty Discord, aplikácie, ktoré môžete integrovať, a tipy na rozhovory s hosťami.

OpenOffice.org Cheat Sheet pre LuckyTemplates

OpenOffice.org Cheat Sheet pre LuckyTemplates

Kancelársky balík OpenOffice.org má množstvo nástrojov na uľahčenie pracovného života. Keď pracujete v OpenOffice.org, zoznámte sa s funkčným panelom nástrojov (ktorý vyzerá takmer rovnako vo všetkých aplikáciách) a tlačidlami hlavného panela nástrojov, ktoré vám pomôžu so základnými príkazmi pre väčšinu úloh.

Bombe stroj Alana Turinga

Bombe stroj Alana Turinga

Stroj Bombe Alana Turinga nebol žiadnou formou umelej inteligencie (AI). V skutočnosti to ani nie je skutočný počítač. Prelomilo to kryptografické správy Enigmy a to je všetko. Turingovi to však poskytlo podnet na zamyslenie, čo nakoniec viedlo k dokumentu s názvom „Výpočtové stroje a inteligencia“? ktorý publikoval v 50-tych rokoch a ktorý popisuje […]