Kā mākslīgais intelekts tiek galā ar trūkstošiem datiem

Lai pareizi atbildētu uz doto jautājumu, jums ir jābūt visiem faktiem. Jūs varat uzminēt atbildi uz jautājumu bez visiem faktiem, taču tad atbilde ir tikpat liela, kā nepareiza un pareiza. Bieži tiek teikts, ka kāds, kurš pieņem lēmumu, būtībā atbildot uz jautājumu, bez visiem faktiem, piesteidzas pie secinājuma. Analizējot datus, iespējams, trūkstošo datu dēļ esat izdarījis vairāk secinājumu, nekā domājat. Datu ieraksta, viens ieraksts ar datu kopā (kas ir visi dati), sastāv no laukiem , kas satur faktus, ko izmanto, lai atbildētu uz jautājumu. Katrs lauks satur viena veida datus, kas attiecas uz vienu faktu. Ja šis lauks ir tukšs, jums nav datu, kas nepieciešami, lai atbildētu uz jautājumu, izmantojot konkrēto datu ierakstu.

Trūkstošo datu apstrādes procesā jums jāzina, ka trūkst datu. Identificēt, ka jūsu datu kopā trūkst informācijas, patiesībā var būt diezgan grūti, jo jums ir nepieciešams aplūkot datus zemā līmenī — tam vairums cilvēku nav gatavi, un tas aizņem daudz laika, pat ja jums ir nepieciešamās prasmes. Bieži vien pirmais pavediens, ka trūkst datu, ir absurdās atbildes, ko uz jūsu jautājumiem iegūst no algoritma un saistītās datu kopas. Ja algoritms ir pareizais lietošanai, datu kopai ir jābūt vainīgai.

Problēma var rasties, ja datu vākšanas procesā nav iekļauti visi dati, kas nepieciešami, lai atbildētu uz konkrētu jautājumu. Dažreiz labāk ir atmest faktu, nevis izmantot ievērojami bojātu faktu. Ja atklājat, ka konkrētam datu kopas laukam trūkst 90 procentu vai vairāk tā datu, lauks kļūst nederīgs, un tas ir jāizmet no datu kopas (vai jāatrod veids, kā iegūt visus šos datus).

Mazāk bojātos laukos datu var trūkt vienā no diviem veidiem. Nejauši trūkstošie dati bieži vien ir cilvēka vai sensora kļūdas rezultāts. Tas notiek, ja datu ierakstos visā datu kopā trūkst ierakstu. Dažreiz vienkārša kļūme var izraisīt bojājumus. Secīgi trūkstošie dati rodas kāda veida vispārinātas kļūmes laikā. Visam datu kopas datu ierakstu segmentam trūkst vajadzīgās informācijas, kas nozīmē, ka iegūtā analīze var kļūt diezgan šķība.

Visvieglāk ir labot nejauši trūkstošos datus. Kā aizstājēju varat izmantot vienkāršu vidējo vai vidējo vērtību. Nē, datu kopa nav pilnīgi precīza, taču tā, visticamāk, darbosies pietiekami labi, lai iegūtu saprātīgu atbildi. Dažos gadījumos datu zinātnieki izmantoja īpašu algoritmu, lai aprēķinātu trūkstošo vērtību, kas var padarīt datu kopu precīzāku uz skaitļošanas laika rēķina.

Secīgi trūkstošos datus ir ievērojami grūtāk vai pat neiespējami labot, jo trūkst apkārtējo datu, uz kuriem balstīt jebkāda veida minējumus. Ja varat atrast trūkstošo datu cēloni, dažreiz varat tos rekonstruēt. Tomēr, kad rekonstrukcija kļūst neiespējama, varat izvēlēties ignorēt šo lauku. Diemžēl dažām atbildēm būs nepieciešams šis lauks, kas nozīmē, ka jums, iespējams, vajadzēs ignorēt šo konkrēto datu ierakstu secību, kas var izraisīt nepareizu izvadi.


Senioriem: kā ievietot klipkopu PowerPoint slaidā

Senioriem: kā ievietot klipkopu PowerPoint slaidā

Klipkopas ir iepriekš zīmēti vispārīgi mākslas darbi, un Microsoft piedāvā daudzus klipkopas failus bez maksas ar saviem Office produktiem. Varat ievietot klipkopas savā PowerPoint slaidu izkārtojumā. Vienkāršākais veids, kā ievietot klipkopas, ir izmantot vienu no vietturi slaidu izkārtojumā: Parādiet slaidu, kurā ir klipkopa […]

Senioriem: Kā aizpildīt krāsu programmā Microsoft Excel

Senioriem: Kā aizpildīt krāsu programmā Microsoft Excel

Aizpildījuma krāsa (saukta arī par ēnojumu) ir krāsa vai raksts, kas aizpilda vienas vai vairāku Excel darblapas šūnu fonu. Aizēnojuma izmantošana var palīdzēt lasītāja acīm sekot informācijai visā lapā un var pievienot darblapai krāsu un vizuālu interesi. Dažos izklājlapu veidos, piemēram, čeku grāmatiņas reģistrā, […]

Jaunu kontaktu pievienošana likumā! 2005. gads

Jaunu kontaktu pievienošana likumā! 2005. gads

Vienkāršākajā līmenī ACT galvenais mērķis! kalpo kā vieta, kur glabāt visus kontaktus, ar kuriem ikdienā sazināties. Jūs varat pievienot un rediģēt visas savas kontaktpersonas kontaktinformācijas logā, jo tajā ir visa informācija, kas attiecas uz vienu konkrētu ierakstu un […]

Discord For LuckyTemplates apkrāptu lapa

Discord For LuckyTemplates apkrāptu lapa

Izmantojiet šo apkrāptu lapu, lai tieši sāktu lietot Discord. Atklājiet noderīgus Discord robotprogrammatūras, integrētās lietotnes un padomus viesu intervēšanai.

OpenOffice.org LuckyTemplates apkrāptu lapai

OpenOffice.org LuckyTemplates apkrāptu lapai

OpenOffice.org biroja komplektā ir daudz rīku, kas atvieglo darba dzīvi. Strādājot vietnē OpenOffice.org, iepazīstieties ar funkciju rīkjoslu (kas visās lietojumprogrammās izskatās gandrīz vienādi) un galvenās rīkjoslas pogas, lai palīdzētu ar pamata komandām lielākajai daļai uzdevumu.

Alana Tjūringa bumbas mašīna

Alana Tjūringa bumbas mašīna

Alana Tjūringa Bombe mašīna nebija nekāds mākslīgā intelekta (AI) veids. Patiesībā tas pat nav īsts dators. Tas lauza Enigma kriptogrāfiskos ziņojumus, un tas arī viss. Tomēr Tjūringam tas deva vielu pārdomām, kā rezultātā galu galā tika izveidots raksts ar nosaukumu “Datortehnika un izlūkdati”. ko viņš publicēja pagājušā gadsimta piecdesmitajos gados un kurā aprakstīts […]

Standarta aparatūras trūkumi mākslīgajam intelektam

Standarta aparatūras trūkumi mākslīgajam intelektam

Spējai izveidot moduļu sistēmu patiešām ir ievērojamas priekšrocības, īpaši biznesā. Iespēja noņemt un nomainīt atsevišķus komponentus samazina izmaksas, vienlaikus ļaujot pakāpeniski uzlabot gan ātrumu, gan efektivitāti. Tomēr, tāpat kā lielākajā daļā lietu, bezmaksas pusdienu nav. Von Neumann arhitektūras nodrošinātā modularitāte ir saistīta ar dažiem […]

10 Ko drīkst un ko nedrīkst, lietojot QuarkXPress

10 Ko drīkst un ko nedrīkst, lietojot QuarkXPress

Ja jums būtu jāizvēlas desmit viegli aizmirstamas, bet ārkārtīgi noderīgas lietas, ko atcerēties par QuarkXPress, nākamajā sarakstā, dārgais lasītāj, tās būtu tās. Namaste. Sazinieties ar savu komerciālo printeri Visi drukas projekti sākas un beidzas ar printeri. Tas ir tāpēc, ka tikai printeri zina savus ierobežojumus un tūkstošiem veidu, kā projekts var būt […]

Bitcoin izcelsme

Bitcoin izcelsme

Vissvarīgākais bitkoina aspekts var būt aiz tā esošā koncepcija. Bitcoin izveidoja izstrādātājs Satoshi Nakamoto. Tā vietā, lai mēģinātu izstrādāt pilnīgi jaunu maksājuma veidu, lai izjauktu veidu, kā mēs visi maksājam par lietām tiešsaistē, Satoshi redzēja noteiktas problēmas esošajās maksājumu sistēmās un vēlējās tās risināt. Jēdziens […]

Kā aizsargāt savu privātumu, izmantojot Bitcoin

Kā aizsargāt savu privātumu, izmantojot Bitcoin

Zināms anonimitātes līmenis ir saistīts ar bitcoin un digitālās valūtas izmantošanu kopumā. Tas, vai varat to atzīmēt kā “pietiekami anonīmu”, ir personisks viedoklis. Ir veidi, kā aizsargāt savu privātumu, izmantojot bitcoīnu līdzekļu pārvietošanai, taču tas prasa zināmas pūles un plānošanu: varat izveidot jaunu adresi […]