Ako sa umelá inteligencia vysporiadava s chýbajúcimi údajmi

Aby ste správne odpovedali na danú otázku, musíte poznať všetky fakty. Môžete uhádnuť odpoveď na otázku bez všetkých faktov, ale potom je odpoveď rovnako pravdepodobne nesprávna ako správna. Často sa hovorí, že niekto, kto sa rozhodne, v podstate odpovie na otázku, bez všetkých faktov, urobí unáhlený záver. Pri analýze údajov ste pravdepodobne kvôli chýbajúcim údajom urobili viac záverov, ako si myslíte. Záznam dát, jedna položka v dátovom súbore (čo je všetky dáta), sa skladá z polí , ktoré obsahujú skutočnosti použiť na odpovedať na otázku. Každé pole obsahuje jeden druh údajov, ktoré sa týkajú jednej skutočnosti. Ak je toto pole prázdne, nemáte údaje, ktoré potrebujete na zodpovedanie otázky pomocou konkrétneho údajového záznamu.

V rámci procesu riešenia chýbajúcich údajov musíte vedieť, že údaje chýbajú. Identifikovať, že vo vašom súbore údajov chýbajú informácie, môže byť v skutočnosti dosť ťažké, pretože vyžaduje, aby ste sa na údaje pozerali na nízkej úrovni – niečo, na čo väčšina ľudí nie je pripravená a je to časovo náročné, aj keď máte požadované zručnosti. Často sú vaším prvým vodítkom, že chýbajú údaje, absurdné odpovede, ktoré vaše otázky získavajú z algoritmu a súvisiaceho súboru údajov. Keď je algoritmus správny na použitie, chyba musí byť v súbore údajov.

Problém môže nastať, keď proces zberu údajov nezahŕňa všetky údaje potrebné na zodpovedanie konkrétnej otázky. Niekedy je lepšie fakt vypustiť, ako použiť značne poškodený fakt. Ak zistíte, že určitému poľu v množine údajov chýba 90 alebo viac percent údajov, pole sa stane neužitočným a musíte ho z množiny údajov odstrániť (alebo nájsť nejaký spôsob, ako získať všetky tieto údaje).

V menej poškodených poliach môžu chýbať údaje jedným z dvoch spôsobov. Náhodne chýbajúce údaje sú často výsledkom ľudskej chyby alebo chyby senzora. Vyskytuje sa vtedy, keď v dátových záznamoch v celej množine údajov chýbajú položky. Niekedy spôsobí škodu aj obyčajná chyba. Postupne chýbajúce údaje sa vyskytujú počas určitého typu všeobecného zlyhania. Celému segmentu dátových záznamov v dátovom súbore chýbajú požadované informácie, čo znamená, že výsledná analýza môže byť značne skreslená.

Oprava náhodne chýbajúcich údajov je najjednoduchšia. Ako náhradu môžete použiť jednoduchý medián alebo priemernú hodnotu. Nie, súbor údajov nie je úplne presný, ale pravdepodobne bude fungovať dostatočne dobre na získanie rozumnej odpovede. V niektorých prípadoch vedci údajov použili špeciálny algoritmus na výpočet chýbajúcej hodnoty, čo môže spresniť súbor údajov na úkor výpočtového času.

Postupne chýbajúce údaje je podstatne ťažšie, ak nie nemožné, opraviť, pretože vám chýbajú akékoľvek okolité údaje, na ktorých by ste mohli založiť akýkoľvek druh odhadu. Ak nájdete príčinu chýbajúcich údajov, môžete ich niekedy zrekonštruovať. Keď sa však rekonštrukcia stane nemožnou, môžete sa rozhodnúť pole ignorovať. Bohužiaľ, niektoré odpovede budú vyžadovať toto pole, čo znamená, že možno budete musieť ignorovať túto konkrétnu sekvenciu dátových záznamov, čo môže spôsobiť nesprávny výstup.


Pre seniorov: Ako vložiť klipart do snímky programu PowerPoint

Pre seniorov: Ako vložiť klipart do snímky programu PowerPoint

Klipart je predkreslená generická kresba a spoločnosť Microsoft poskytuje veľa súborov klipartov zadarmo so svojimi produktmi Office. Do rozloženia snímky programu PowerPoint môžete vložiť klipart. Najjednoduchší spôsob vloženia klipartov je pomocou jedného zo zástupných symbolov na rozložení snímky: Zobrazte snímku, ktorá obsahuje klipart […]

Pre seniorov: Ako vyplniť farbu v programe Microsoft Excel

Pre seniorov: Ako vyplniť farbu v programe Microsoft Excel

Farba výplne – tiež nazývaná tieňovanie – je farba alebo vzor, ​​ktorý vypĺňa pozadie jednej alebo viacerých buniek hárka programu Excel. Použitie tieňovania môže pomôcť očiam čitateľa sledovať informácie na stránke a môže pridať farbu a vizuálny záujem do pracovného hárka. V niektorých typoch tabuliek, ako je register šekových knižiek, […]

Pridávanie nových kontaktov do služby Act! 2005

Pridávanie nových kontaktov do služby Act! 2005

Na úplne najjednoduchšej úrovni je hlavným účelom ACT! má slúžiť ako miesto na uloženie všetkých kontaktov, s ktorými denne komunikujete. Všetky svoje kontakty môžete pridávať a upravovať z okna Podrobnosti kontaktu, pretože obsahuje všetky informácie, ktoré sa týkajú jedného konkrétneho záznamu a […]

Discord For LuckyTemplates Cheat Sheet

Discord For LuckyTemplates Cheat Sheet

Použite tento Cheat Sheet na skok priamo do používania Discordu. Objavte užitočné roboty Discord, aplikácie, ktoré môžete integrovať, a tipy na rozhovory s hosťami.

OpenOffice.org Cheat Sheet pre LuckyTemplates

OpenOffice.org Cheat Sheet pre LuckyTemplates

Kancelársky balík OpenOffice.org má množstvo nástrojov na uľahčenie pracovného života. Keď pracujete v OpenOffice.org, zoznámte sa s funkčným panelom nástrojov (ktorý vyzerá takmer rovnako vo všetkých aplikáciách) a tlačidlami hlavného panela nástrojov, ktoré vám pomôžu so základnými príkazmi pre väčšinu úloh.

Bombe stroj Alana Turinga

Bombe stroj Alana Turinga

Stroj Bombe Alana Turinga nebol žiadnou formou umelej inteligencie (AI). V skutočnosti to ani nie je skutočný počítač. Prelomilo to kryptografické správy Enigmy a to je všetko. Turingovi to však poskytlo podnet na zamyslenie, čo nakoniec viedlo k dokumentu s názvom „Výpočtové stroje a inteligencia“? ktorý publikoval v 50-tych rokoch a ktorý popisuje […]

Štandardné hardvérové ​​nedostatky pre umelú inteligenciu

Štandardné hardvérové ​​nedostatky pre umelú inteligenciu

Schopnosť vytvoriť modulárny systém má značné výhody, najmä v podnikaní. Možnosť odstraňovania a výmeny jednotlivých komponentov udržuje nízke náklady a zároveň umožňuje postupné zlepšovanie rýchlosti a efektívnosti. Ako pri väčšine vecí však ani tu nie je obed zadarmo. Modularita poskytovaná architektúrou Von Neumann prichádza s niektorými […]

10 Čo robiť a čo robiť pri používaní QuarkXPress

10 Čo robiť a čo robiť pri používaní QuarkXPress

Ak by ste mali vybrať desať ľahko zabudnuteľných, no mimoriadne užitočných vecí, ktoré by ste si o QuarkXPress zapamätali, v nasledujúcom zozname by ste, milý čitateľ, boli práve nimi. Namaste. Hovorte so svojou komerčnou tlačiarňou Všetky tlačové projekty začínajú a končia pri tlačiarni. Je to preto, že iba tlačiarne poznajú svoje obmedzenia a tisíce spôsobov, ako môže byť projekt […]

Pôvod Bitcoinu

Pôvod Bitcoinu

Najdôležitejším aspektom bitcoinu môže byť koncept za ním. Bitcoin vytvoril vývojár Satoshi Nakamoto. Namiesto toho, aby sa Satoshi snažil navrhnúť úplne novú platobnú metódu, aby zvrhol spôsob, akým všetci platíme za veci online, videl Satoshi určité problémy s existujúcimi platobnými systémami a chcel ich riešiť. Koncept […]

Ako chrániť svoje súkromie pri používaní bitcoínov

Ako chrániť svoje súkromie pri používaní bitcoínov

S používaním bitcoinu a digitálnej meny vo všeobecnosti sa viaže určitá úroveň anonymity. Či to môžete označiť ako „dostatočne anonymné“, je osobný názor. Existujú spôsoby, ako chrániť svoje súkromie pri používaní bitcoinov na presun finančných prostriedkov, ale vyžadujú si určité úsilie a plánovanie: Môžete si vygenerovať novú adresu pre […]