Kako umetna inteligenca obravnava manjkajoče podatke

Če želite pravilno odgovoriti na dano vprašanje, morate imeti vsa dejstva. Odgovor na vprašanje lahko ugibate brez vseh dejstev, vendar je potem odgovor enako verjetno napačen kot pravilen. Pogosto se reče, da nekdo, ki sprejme odločitev, v bistvu odgovori na vprašanje, brez vseh dejstev, prehitro sklepa. Ko analizirate podatke, ste verjetno zaradi manjkajočih podatkov preskočili do več zaključkov, kot si mislite. Zapis podatkov, en vnos v naboru podatkov (ki so vsi podatki), je sestavljen iz polj , ki vsebujejo dejstva, ki se uporabljajo za odgovor na vprašanje. Vsako polje vsebuje eno vrsto podatkov, ki obravnava posamezno dejstvo. Če je to polje prazno, nimate podatkov, ki jih potrebujete, da odgovorite na vprašanje s tem določenim podatkovnim zapisom.

V okviru postopka obravnave manjkajočih podatkov morate vedeti, da podatki manjkajo. Prepoznavanje, da v vašem nizu podatkov manjkajo informacije, je lahko precej težko, saj zahteva, da podatke pogledate na nizki ravni – nekaj, na kar večina ljudi ni pripravljena in je zamudno, tudi če imate zahtevane veščine. Pogosto so vaš prvi namig, da podatki manjkajo, nesmiselni odgovori, ki jih vaša vprašanja dobijo iz algoritma in povezanega nabora podatkov. Če je algoritem pravi za uporabo, mora biti nabor podatkov kriv.

Težava se lahko pojavi, če postopek zbiranja podatkov ne vključuje vseh podatkov, potrebnih za odgovor na določeno vprašanje. Včasih je bolje, da dejansko opustiš dejstvo, kot pa uporabiš precej poškodovano dejstvo. Če ugotovite, da določenemu polju v naboru podatkov manjka 90 odstotkov ali več njegovih podatkov, postane polje neuporabno in ga morate izpustiti iz nabora podatkov (ali najti način za pridobitev vseh teh podatkov).

Na manj poškodovanih poljih lahko podatki manjkajo na enega od dveh načinov. Naključno manjkajoči podatki so pogosto posledica človeške ali senzorske napake. Pojavi se, ko v podatkovnih zapisih v celotnem naboru podatkov manjkajo vnosi. Včasih lahko škodo povzroči preprosta napaka. Zaporedno manjkajoči podatki se pojavijo med določeno vrsto splošne napake. Celoten segment podatkovnih zapisov v naboru podatkov nima zahtevanih informacij, kar pomeni, da lahko nastala analiza postane precej izkrivljena.

Najlažje je popraviti naključno manjkajoče podatke. Kot zamenjavo lahko uporabite preprosto mediano ali povprečno vrednost. Ne, nabor podatkov ni povsem natančen, vendar bo verjetno deloval dovolj dobro, da bo dobil razumen odgovor. V nekaterih primerih so podatkovni znanstveniki uporabili poseben algoritem za izračun manjkajoče vrednosti, ki lahko naredi nabor podatkov natančnejši na račun računalniškega časa.

Zaporedno manjkajoče podatke je bistveno težje, če ne celo nemogoče popraviti, ker nimate nobenih okoliških podatkov, na katerih bi lahko ugibali. Če lahko najdete vzrok za manjkajoče podatke, ga lahko včasih rekonstruirate. Ko pa rekonstrukcija postane nemogoča, se lahko odločite, da polje prezrete. Na žalost bodo nekateri odgovori zahtevali to polje, kar pomeni, da boste morda morali prezreti to določeno zaporedje podatkovnih zapisov – kar lahko povzroči napačen izpis.


Za starejše: Kako vstaviti izrezke v diapozitiv PowerPoint

Za starejše: Kako vstaviti izrezke v diapozitiv PowerPoint

Izrezki so vnaprej narisane splošne umetnine, Microsoft pa s svojimi izdelki Office brezplačno ponuja številne datoteke z izrezki. Izrezke lahko vstavite v postavitev diapozitiva PowerPoint. Najlažji način za vstavljanje izrezka je uporaba enega od označb mesta na postavitvi diapozitiva: Prikažite diapozitiv, ki vsebuje izrezek […]

Za starejše: Kako zapolniti barvo v Microsoft Excelu

Za starejše: Kako zapolniti barvo v Microsoft Excelu

Barva polnila – imenovana tudi senčenje – je barva ali vzorec, ki zapolni ozadje ene ali več celic delovnega lista Excel. Uporaba senčenja lahko pomaga bralčevim očem slediti informacijam po strani ter lahko delovnemu listu doda barvo in vizualno zanimanje. V nekaterih vrstah preglednic, kot je register čekovne knjige, […]

Dodajanje novih stikov v Act! 2005

Dodajanje novih stikov v Act! 2005

Na zelo preprosti ravni je glavni namen ACT! služi kot prostor za shranjevanje vseh stikov, s katerimi dnevno komunicirate. Vse svoje stike lahko dodate in uredite v oknu s podrobnostmi o stiku, ker vsebuje vse informacije, ki se nanašajo na en določen zapis in […]

Discord For LuckyTemplates Cheat Sheet

Discord For LuckyTemplates Cheat Sheet

Uporabite to Cheat Sheet, da takoj začnete uporabljati Discord. Odkrijte koristne bote Discord, aplikacije, ki jih lahko integrirate, in nasvete za intervjuje z gosti.

OpenOffice.org Za LuckyTemplates Cheat Sheet

OpenOffice.org Za LuckyTemplates Cheat Sheet

Pisarniški paket OpenOffice.org ima veliko orodij za lažje delo. Ko delate v OpenOffice.org, spoznajte funkcijsko orodno vrstico (ki je v vseh aplikacijah videti skoraj enako) in glavne gumbe orodne vrstice za pomoč pri osnovnih ukazih za večino opravil.

Bombe Machine Alana Turinga

Bombe Machine Alana Turinga

Stroj Bombe Alana Turinga ni bil nobena oblika umetne inteligence (AI). Pravzaprav niti ni pravi računalnik. Razbil je kriptografska sporočila Enigme in to je to. Vendar pa je Turingu zagotovilo razmislek, kar je na koncu pripeljalo do članka z naslovom “Computing Machinery and Intelligenceâ€?? ki ga je objavil v petdesetih letih prejšnjega stoletja in opisuje […]

Standardne pomanjkljivosti strojne opreme za umetno inteligenco

Standardne pomanjkljivosti strojne opreme za umetno inteligenco

Sposobnost ustvarjanja modularnega sistema ima pomembne prednosti, zlasti v poslu. Zmožnost odstranjevanja in zamenjave posameznih komponent ohranja nizke stroške, hkrati pa omogoča postopno izboljšanje hitrosti in učinkovitosti. Vendar, tako kot pri večini stvari, ni brezplačnega kosila. Modularnost, ki jo zagotavlja Von Neumannova arhitektura, prihaja z nekaj […]

10 stvari, ki jih je treba storiti in kaj storiti pri uporabi QuarkXPress

10 stvari, ki jih je treba storiti in kaj storiti pri uporabi QuarkXPress

Če bi morali izbrati deset stvari o QuarkXPressu, ki jih je enostavno pozabiti, a izjemno uporabnih, ki bi si jih zapomnili, bi bile tiste na naslednjem seznamu, dragi bralec, to. Namaste. Pogovorite se s svojim komercialnim tiskalnikom. Vsi projekti tiskanja se začnejo in končajo s tiskalnikom. To je zato, ker samo tiskarji poznajo svoje omejitve in na tisoče načinov, kako je projekt lahko […]

Izvor Bitcoina

Izvor Bitcoina

Najpomembnejši vidik bitcoina je morda koncept, ki stoji za njim. Bitcoin je ustvaril razvijalec Satoshi Nakamoto. Namesto da bi poskušal oblikovati popolnoma novo plačilno sredstvo, ki bi uničil način, kako vsi plačujemo stvari na spletu, je Satoshi videl določene težave z obstoječimi plačilnimi sistemi in jih želel odpraviti. Koncept […]

Kako zaščititi svojo zasebnost pri uporabi Bitcoin

Kako zaščititi svojo zasebnost pri uporabi Bitcoin

Določena raven anonimnosti je vezana na uporabo bitcoina in digitalne valute na splošno. Ali lahko to označite kot "dovolj anonimno", je osebno mnenje. Obstajajo načini za zaščito vaše zasebnosti, ko uporabljate bitcoin za premikanje sredstev, vendar ti zahtevajo nekaj truda in načrtovanja: ustvarite lahko nov naslov za […]