Kuidas tehisintellekt puuduvate andmetega tegeleb

Et vastata küsimusele õigesti, peavad teil olema kõik faktid. Võite arvata vastuse küsimusele ilma kõigi faktideta, kuid siis on vastus sama suure tõenäosusega vale kui õige. Sageli öeldakse, et keegi, kes teeb otsuse, vastates sisuliselt küsimusele, ilma kõigi faktideta, teeb kiire järelduse. Andmete analüüsimisel olete tõenäoliselt teinud andmete puudumise tõttu rohkem kiireid järeldusi, kui arvate. Andmete rekord, üks kanne andmekogumi (mis on kõik andmed), koosneb väljad , mis sisaldavad fakte kasutatud vastata küsimusele. Iga väli sisaldab ühte tüüpi andmeid, mis käsitlevad ühte fakti. Kui see väli on tühi, pole teil andmeid, mida vajate selle konkreetse andmekirje abil küsimusele vastamiseks.

Osana puuduvate andmetega tegelemise protsessist peate teadma, et andmed puuduvad. Andmestikust puuduva teabe tuvastamine võib tegelikult olla üsna keeruline, kuna see nõuab andmete madalat vaatamist – see on midagi, milleks enamik inimesi pole valmis ja see on aeganõudev, isegi kui teil on vajalikud oskused. Sageli on teie esimene vihje, et andmed puuduvad, absurdsed vastused, mis teie küsimustele algoritmist ja sellega seotud andmekogumist saate. Kui algoritm on kasutamiseks õige, peab viga olema andmestikus.

Probleem võib tekkida siis, kui andmete kogumise protsess ei sisalda kõiki konkreetsele küsimusele vastamiseks vajalikke andmeid. Mõnikord on parem fakti kõrvale heita, selle asemel, et kasutada oluliselt kahjustatud fakti. Kui leiate, et andmestiku konkreetsel väljal on 90 protsenti või rohkem andmetest puudu, muutub väli kasutuks ja peate selle andmestikust välja jätma (või leidma võimaluse kõigi nende andmete hankimiseks).

Vähem kahjustatud väljadel võivad andmed puududa kahel viisil. Juhuslikult puuduvad andmed on sageli inimese või anduri vea tagajärg. See juhtub siis, kui kogu andmestiku andmekirjetes on puuduvaid kirjeid. Mõnikord põhjustab kahju lihtne tõrge. Järjestikku puuduvad andmed ilmnevad teatud tüüpi üldistatud tõrke korral. Tervel andmekogumi andmekirjete segmendil puudub nõutav teave, mis tähendab, et tulemuseks olev analüüs võib muutuda üsna viltu.

Juhuslikult puuduvate andmete parandamine on kõige lihtsam. Asendusena saate kasutada lihtsat mediaan- või keskmist väärtust. Ei, andmestik ei ole täiesti täpne, kuid tõenäoliselt töötab see piisavalt hästi, et saada mõistlikku vastust. Mõnel juhul kasutasid andmeteadlased puuduva väärtuse arvutamiseks spetsiaalset algoritmi, mis võib andmestiku arvutusaja arvelt täpsemaks muuta.

Järjestikku puuduvaid andmeid on oluliselt raskem, kui mitte võimatu parandada, kuna teil puuduvad ümbritsevad andmed, mille põhjal oleks võimalik arvata. Kui leiate puuduvate andmete põhjuse, saate need mõnikord taastada. Kui aga rekonstrueerimine muutub võimatuks, võite seda välja ignoreerida. Kahjuks nõuavad mõned vastused seda välja, mis tähendab, et peate võib-olla seda konkreetset andmekirjete jada ignoreerima, mis võib põhjustada vale väljundi.


Eakate jaoks: kuidas sisestada lõikepilte PowerPointi slaidile

Eakate jaoks: kuidas sisestada lõikepilte PowerPointi slaidile

Lõikepilt on eeljoonistatud üldine kunstiteos ja Microsoft pakub oma Office'i toodetega tasuta palju lõikepildifaile. Saate sisestada oma PowerPointi slaidipaigutusse lõikepilte. Lihtsaim viis lõikepildi sisestamiseks on kasutada slaidipaigutamisel üht kohatäitjat: kuvage lõikepilte sisaldav slaid […]

Eakate jaoks: kuidas täita värvi Microsoft Excelis

Eakate jaoks: kuidas täita värvi Microsoft Excelis

Täitevärv (mida nimetatakse ka varjutamiseks) on värv või muster, mis täidab ühe või mitme Exceli töölehe lahtri tausta. Varjutuse rakendamine võib aidata lugejal kogu lehel teavet jälgida ning lisada töölehel värvi ja visuaalset huvi. Teatud tüüpi tabelites, näiteks tšekiraamatute registris, […]

Uute kontaktide lisamine seadusesse! 2005

Uute kontaktide lisamine seadusesse! 2005

Kõige lihtsamal tasandil ACTi peamine eesmärk! on koht, kuhu salvestada kõik kontaktid, kellega igapäevaselt suhtlete. Saate kõiki oma kontakte lisada ja muuta kontaktandmete aknas, kuna see sisaldab kogu teavet, mis puudutab ühte konkreetset kirjet ja […]

Discord For LuckyTemplates petuleht

Discord For LuckyTemplates petuleht

Kasutage seda petulehte, et otse Discordi kasutama hakata. Avastage kasulikke Discordi roboteid, rakendusi, mida saate integreerida, ja näpunäiteid külaliste intervjueerimiseks.

OpenOffice.org LuckyTemplatesi petulehe jaoks

OpenOffice.org LuckyTemplatesi petulehe jaoks

OpenOffice.org kontorikomplektis on palju tööriistu, mis muudavad tööelu lihtsamaks. Kui töötate saidil OpenOffice.org, tutvuge funktsioonide tööriistariba (mis näeb kõigis rakendustes üsna ühesugune välja) ja peamiste tööriistariba nuppudega, et saada abi põhikäskudega enamiku toimingute jaoks.

Alan Turingi pommimasin

Alan Turingi pommimasin

Alan Turingi Bombe masin ei olnud tehisintellekti (AI) vorm. Tegelikult pole see isegi päris arvuti. See purustas Enigma krüptograafilised sõnumid ja see on kõik. Siiski pakkus see Turingile mõtlemisainet, mis viis lõpuks artiklini "Arvutusmasinad ja intelligentsus". mille ta avaldas 1950. aastatel ja kirjeldab […]

Tehisintellekti standardsed riistvarapuudused

Tehisintellekti standardsed riistvarapuudused

Modulaarse süsteemi loomise võimalusel on olulisi eeliseid, eriti ettevõtluses. Üksikute komponentide eemaldamise ja asendamise võimalus hoiab kulud madalal, võimaldades samal ajal järk-järgult parandada nii kiirust kui ka tõhusust. Samas nagu enamiku asjadega, tasuta lõunasööki pole olemas. Von Neumanni arhitektuuri pakutav modulaarsus sisaldab mõningaid […]

10 toimingut ja keeldu QuarkXPressi kasutamisel

10 toimingut ja keeldu QuarkXPressi kasutamisel

Kui sa peaksid QuarkXPressi kohta välja valima kümme kergesti unustatavat, kuid ülikasulikku asja, siis järgmises loendis, hea lugeja, oleksid just need. Namaste. Rääkige oma kommertsprinteriga Kõik prindiprojektid algavad ja lõpevad printeriga. Seda seetõttu, et ainult printerid teavad oma piiranguid ja tuhandeid viise, kuidas projekt võib olla […]

Bitcoini päritolu

Bitcoini päritolu

Bitcoini kõige olulisem aspekt võib olla selle kontseptsioon. Bitcoini lõi arendaja Satoshi Nakamoto. Selle asemel, et püüda välja töötada täiesti uus makseviis, et kaotada viis, kuidas me kõik veebis asjade eest maksame, nägi Satoshi olemasolevates maksesüsteemides teatud probleeme ja soovis nendega tegeleda. Mõiste […]

Kuidas kaitsta oma privaatsust Bitcoini kasutamisel

Kuidas kaitsta oma privaatsust Bitcoini kasutamisel

Teatud anonüümsuse tase on seotud bitcoini ja digitaalse valuuta kasutamisega üldiselt. See, kas saate selle märgistada "piisavalt anonüümseks", on isiklik arvamus. Kui kasutate bitcoine raha ümberpaigutamiseks, on privaatsuse kaitsmiseks viise, kuid need nõuavad pingutust ja planeerimist: saate luua uue aadressi […]