Kaip dirbtinis intelektas susidoroja su trūkstamais duomenimis

Norėdami teisingai atsakyti į pateiktą klausimą, turite turėti visus faktus. Jūs galite atspėti atsakymą į klausimą be visų faktų, bet tada yra tiek pat tikimybė, kad atsakymas bus neteisingas ir teisingas. Dažnai sakoma, kad kažkas, kas priima sprendimą, iš esmės atsakydamas į klausimą, nepateikdamas visų faktų, daro skubotą išvadą. Analizuodami duomenis tikriausiai padarėte daugiau išvadų, nei manote, nes trūksta duomenų. Duomenų įrašas, vienas įrašas į rinkinį (kuris yra visi duomenys), susideda iš laukų , kuriuose yra faktai naudojami atsakyti į klausimą. Kiekviename lauke yra vienos rūšies duomenys, susiję su vienu faktu. Jei šis laukas tuščias, neturite duomenų, kurių reikia norint atsakyti į klausimą naudodami tą konkretų duomenų įrašą.

Tvarkydami trūkstamus duomenis turite žinoti, kad trūksta duomenų. Nustatyti, kad duomenų rinkinyje trūksta informacijos, iš tikrųjų gali būti gana sunku, nes reikia žiūrėti į duomenis žemu lygiu – tai dauguma žmonių nėra pasiruošę ir užima daug laiko, net jei turite reikiamų įgūdžių. Dažnai pirmasis užuomina, kad trūksta duomenų, yra absurdiški atsakymai, kuriuos į jūsų klausimus gaunate iš algoritmo ir susijusio duomenų rinkinio. Kai algoritmas yra tinkamas naudoti, duomenų rinkinys turi būti kaltas.

Problema gali kilti, kai duomenų rinkimo procesas neapima visų duomenų, reikalingų atsakyti į konkretų klausimą. Kartais geriau atmesti faktą, o ne naudoti labai sugadintą faktą. Jei pastebite, kad tam tikrame duomenų rinkinio lauke trūksta 90 procentų ar daugiau duomenų, laukas tampa nenaudingas ir turite jį išmesti iš duomenų rinkinio (arba rasti būdą, kaip gauti visus tuos duomenis).

Mažiau pažeistuose laukuose duomenų gali trūkti vienu iš dviejų būdų. Atsitiktinai trūkstami duomenys dažnai yra žmogaus arba jutiklio klaidos rezultatas. Taip nutinka, kai duomenų įrašuose visame duomenų rinkinyje trūksta įrašų. Kartais žalos padarys paprastas gedimas. Tam tikro tipo apibendrintų gedimų metu nuosekliai trūksta duomenų. Visame duomenų rinkinio duomenų įrašų segmente trūksta reikiamos informacijos, o tai reiškia, kad gauta analizė gali būti gana iškreipta.

Atsitiktinai trūkstamus duomenis pataisyti lengviausia. Kaip pakaitalą galite naudoti paprastą vidutinę arba vidutinę vertę. Ne, duomenų rinkinys nėra visiškai tikslus, bet greičiausiai jis veiks pakankamai gerai, kad gautumėte pagrįstą atsakymą. Kai kuriais atvejais duomenų mokslininkai naudojo specialų algoritmą trūkstamai vertei apskaičiuoti, todėl duomenų rinkinys gali būti tikslesnis skaičiavimo laiko sąskaita.

Pataisyti nuosekliai trūkstamus duomenis yra daug sunkiau, o gal net neįmanoma, nes trūksta aplinkinių duomenų, kuriais remiantis būtų galima spėti. Jei galite rasti trūkstamų duomenų priežastį, kartais galite ją atkurti. Tačiau kai rekonstrukcija tampa neįmanoma, galite nepaisyti lauko. Deja, kai kuriems atsakymams reikės šio lauko, o tai reiškia, kad jums gali tekti nepaisyti konkrečios duomenų įrašų sekos, o tai gali sukelti neteisingą išvestį.


Senjorams: kaip įterpti iliustraciją į „PowerPoint“ skaidrę

Senjorams: kaip įterpti iliustraciją į „PowerPoint“ skaidrę

Iliustracija yra iš anksto nupieštas bendras meno kūrinys, o „Microsoft“ su „Office“ produktais nemokamai teikia daug iliustracijų failų. Galite įterpti iliustraciją į savo „PowerPoint“ skaidrės maketą. Lengviausias būdas įterpti iliustraciją yra naudoti vieną iš vietos rezervavimo ženklų skaidrės makete: Rodyti skaidrę, kurioje yra iliustracija […]

Senjorams: kaip užpildyti spalvą „Microsoft Excel“.

Senjorams: kaip užpildyti spalvą „Microsoft Excel“.

Užpildymo spalva (dar vadinama šešėliavimu) yra spalva arba raštas, užpildantis vienos ar kelių „Excel“ darbalapio langelių foną. Tamsinimas gali padėti skaitytojo akims sekti informaciją visame puslapyje ir suteikti darbalapiui spalvų bei vizualinio susidomėjimo. Kai kurių tipų skaičiuoklėse, pavyzdžiui, čekių knygelės registre, […]

Akte pridedami nauji kontaktai! 2005 m

Akte pridedami nauji kontaktai! 2005 m

Pačiame paprasčiausiu lygmeniu pagrindinis ACT tikslas! yra vieta, kur saugoti visus kontaktus, su kuriais bendraujate kasdien. Galite įtraukti ir redaguoti visus savo kontaktus iš kontaktinės informacijos lange, nes jame yra visa informacija, susijusi su vienu konkrečiu įrašu ir […]

Nesantaika „LuckyTemplates“ sukčiavimo lapas

Nesantaika „LuckyTemplates“ sukčiavimo lapas

Naudokite šį kodų lapą, kad pradėtumėte naudoti „Discord“. Atraskite naudingų „Discord“ robotų, programų, kurias galite integruoti, ir patarimų, kaip apklausti svečius.

OpenOffice.org, skirtas LuckyTemplates Cheat Sheet

OpenOffice.org, skirtas LuckyTemplates Cheat Sheet

OpenOffice.org biuro rinkinyje yra daug įrankių, palengvinančių darbo gyvenimą. Kai dirbate OpenOffice.org, susipažinkite su funkcijų įrankių juosta (kuri beveik visose programose atrodo vienodai) ir pagrindinius įrankių juostos mygtukus, kad gautumėte pagalbos su pagrindinėmis komandomis atliekant daugumą užduočių.

Alano Turingo bombų mašina

Alano Turingo bombų mašina

Alano Turingo Bombe mašina nebuvo jokia dirbtinio intelekto (AI) forma. Tiesą sakant, tai net nėra tikras kompiuteris. Tai sulaužė Enigma kriptografinius pranešimus, ir viskas. Tačiau tai suteikė Turingui peno apmąstymams, todėl galiausiai buvo parengtas straipsnis „Kompiuterinės mašinos ir intelektas“. kurį jis paskelbė šeštajame dešimtmetyje, kuriame aprašoma […]

Standartiniai dirbtinio intelekto aparatūros trūkumai

Standartiniai dirbtinio intelekto aparatūros trūkumai

Galimybė sukurti modulinę sistemą turi daug naudos, ypač versle. Galimybė pašalinti ir pakeisti atskirus komponentus sumažina sąnaudas ir leidžia laipsniškai pagerinti greitį ir efektyvumą. Tačiau, kaip ir daugumoje dalykų, nemokamų pietų nėra. Von Neumann architektūros teikiamas moduliškumas apima kai kuriuos […]

10 Ką daryti ir ko negalima naudojant QuarkXPress

10 Ką daryti ir ko negalima naudojant QuarkXPress

Jei jums reikėtų pasirinkti dešimt lengvai pamirštamų, bet nepaprastai naudingų dalykų, kuriuos reikia prisiminti apie QuarkXPress, toliau pateiktame sąraše, brangus skaitytojau, jie būtų tokie. Namaste. Pasikalbėkite su savo komerciniu spausdintuvu Visi spausdinimo projektai prasideda ir baigiasi spausdintuvu. Taip yra todėl, kad tik spausdintuvai žino savo apribojimus ir tūkstančius būdų, kaip projektas gali būti įgyvendinamas […]

Bitcoin kilmė

Bitcoin kilmė

Svarbiausias bitkoino aspektas gali būti jo koncepcija. Bitcoin sukūrė kūrėjas Satoshi Nakamoto. Užuot bandęs sukurti visiškai naują mokėjimo metodą, kad būtų panaikintas būdas, kuriuo mes visi mokame už daiktus internetu, Satoshi pastebėjo tam tikras esamų mokėjimo sistemų problemas ir norėjo jas išspręsti. Sąvoka […]

Kaip apsaugoti savo privatumą naudojant Bitcoin

Kaip apsaugoti savo privatumą naudojant Bitcoin

Tam tikras anonimiškumo lygis yra susietas su bitkoinų ir skaitmeninės valiutos naudojimu apskritai. Ar galite tai pažymėti kaip „pakankamai anonimišką“, yra asmeninė nuomonė. Yra būdų apsaugoti savo privatumą naudojant bitkoinus lėšoms perkelti, tačiau tam reikia pastangų ir planavimo: galite sugeneruoti naują adresą […]