Kako se umjetna inteligencija nosi s podacima koji nedostaju

Da biste točno odgovorili na zadano pitanje, morate imati sve činjenice. Možete pogoditi odgovor na pitanje bez svih činjenica, ali tada je jednako vjerojatno da će odgovor biti pogrešan kao i točan. Često se za nekoga tko donese odluku, u suštini odgovara na pitanje, bez svih činjenica, kaže da prerano zaključuje. Kada analizirate podatke, vjerojatno ste donijeli više zaključaka nego što mislite zbog podataka koji nedostaju. Zapis podataka, jedan unos u skupu podataka (koji su svi podaci), sastoji se od polja koja sadrže činjenice koje se koriste za odgovor na pitanje. Svako polje sadrži jednu vrstu podataka koji se odnose na jednu činjenicu. Ako je to polje prazno, nemate podatke koji su vam potrebni da odgovorite na pitanje pomoću tog određenog zapisa podataka.

Kao dio procesa rješavanja podataka koji nedostaju, morate znati da podaci nedostaju. Identificirati da vašem skupu podataka nedostaju informacije zapravo može biti prilično teško jer zahtijeva da podatke pogledate na niskoj razini – nešto što većina ljudi nije spremna učiniti i što oduzima mnogo vremena čak i ako imate potrebne vještine. Često, vaš prvi trag da podaci nedostaju su besmisleni odgovori koje vaša pitanja dobivaju iz algoritma i povezanog skupa podataka. Kada je algoritam pravi za korištenje, skup podataka mora biti kriv.

Problem se može pojaviti kada proces prikupljanja podataka ne uključuje sve podatke potrebne za odgovor na određeno pitanje. Ponekad je bolje da zapravo odbacite činjenicu umjesto da koristite znatno oštećenu činjenicu. Ako ustanovite da određenom polju u skupu podataka nedostaje 90 posto ili više podataka, polje postaje beskorisno i trebate ga izbaciti iz skupa podataka (ili pronaći neki način da dobijete sve te podatke).

U manje oštećenim poljima podaci mogu nedostajati na jedan od dva načina. Podaci koji nasumično nedostaju često su rezultat ljudske ili senzorske pogreške. To se događa kada zapisi podataka u cijelom skupu podataka nemaju unose. Ponekad jednostavan kvar može uzrokovati štetu. Podaci koji uzastopno nedostaju javljaju se tijekom neke vrste generaliziranog kvara. Cijelom segmentu zapisa podataka u skupu podataka nedostaju potrebne informacije, što znači da rezultirajuća analiza može postati prilično iskrivljena.

Najlakše je popraviti nasumično nedostajuće podatke. Kao zamjenu možete koristiti jednostavnu srednju ili prosječnu vrijednost. Ne, skup podataka nije potpuno točan, ali će vjerojatno raditi dovoljno dobro da dobije razuman odgovor. U nekim slučajevima, znanstvenici za podatke koristili su poseban algoritam za izračunavanje vrijednosti koja nedostaje, što može učiniti skup podataka točnijim na račun vremena računanja.

Podaci koji nedostaju u sekvenci znatno je teže, ako ne i nemoguće, popraviti jer vam nedostaju okolni podaci na kojima biste mogli temeljiti bilo kakvu vrstu nagađanja. Ako možete pronaći uzrok podataka koji nedostaju, ponekad ih možete rekonstruirati. Međutim, kada rekonstrukcija postane nemoguća, možete odabrati zanemariti polje. Nažalost, neki odgovori zahtijevat će to polje, što znači da ćete možda morati zanemariti taj određeni slijed zapisa podataka - što može uzrokovati netočan izlaz.


Za starije osobe: Kako umetnuti isječak u PowerPoint slajd

Za starije osobe: Kako umetnuti isječak u PowerPoint slajd

Clip art je unaprijed nacrtana generička umjetnička djela, a Microsoft uz svoje proizvode sustava Office besplatno nudi mnoge datoteke s isječcima. Možete umetnuti isječke u svoj PowerPoint raspored slajda. Najlakši način za umetanje isječaka je korištenje jednog od rezerviranih mjesta na rasporedu slajda: Prikažite slajd koji sadrži isječak […]

Za starije: Kako ispuniti boju u Microsoft Excelu

Za starije: Kako ispuniti boju u Microsoft Excelu

Boja ispune — također se naziva sjenčanje — boja je ili uzorak koji ispunjava pozadinu jedne ili više ćelija radnog lista programa Excel. Primjena sjenčanja može pomoći očima čitatelja da prate informacije na stranici i može dodati boju i vizualni interes radnom listu. U nekim vrstama proračunskih tablica, kao što je registar čekovne knjižice, […]

Dodavanje novih kontakata u Zakon! 2005

Dodavanje novih kontakata u Zakon! 2005

Na najjednostavnijoj razini, glavna svrha ACT-a! služi kao mjesto za pohranu svih kontakata s kojima svakodnevno komunicirate. Možete dodavati i uređivati ​​sve svoje kontakte iz prozora s pojedinostima o kontaktu jer sadrži sve informacije koje se odnose na jedan određeni zapis i […]

Discord For LuckyTemplates Cheat Sheet

Discord For LuckyTemplates Cheat Sheet

Upotrijebite ovaj Cheat Sheet kako biste odmah uskočili u korištenje Discorda. Otkrijte korisne Discord botove, aplikacije koje možete integrirati i savjete za intervjuiranje gostiju.

OpenOffice.org za LuckyTemplates Cheat Sheet

OpenOffice.org za LuckyTemplates Cheat Sheet

Uredski paket OpenOffice.org ima mnogo alata koji olakšavaju radni život. Kada radite u OpenOffice.org, upoznajte funkcijsku alatnu traku (koja izgleda prilično isto u svim aplikacijama) i glavne gumbe alatne trake za pomoć s osnovnim naredbama za većinu zadataka.

Stroj za bombe Alana Turinga

Stroj za bombe Alana Turinga

Stroj Bombe Alana Turinga nije bio nikakav oblik umjetne inteligencije (AI). Zapravo, to čak i nije pravo računalo. Razbio je kriptografske poruke Enigme, i to je to. Međutim, to je Turingu pružilo hranu za razmišljanje, što je na kraju dovelo do rada pod naslovom “Computing Machinery and Intelligenceâ€?? koju je objavio 1950-ih koja opisuje […]

Standardni hardverski nedostaci za umjetnu inteligenciju

Standardni hardverski nedostaci za umjetnu inteligenciju

Mogućnost stvaranja modularnog sustava ima značajne prednosti, posebno u poslovanju. Mogućnost uklanjanja i zamjene pojedinačnih komponenti održava troškove niskim, a istovremeno dopušta postepena poboljšanja i brzine i učinkovitosti. Međutim, kao i kod većine stvari, nema besplatnog ručka. Modularnost koju pruža Von Neumannova arhitektura dolazi s nekim […]

10 stvari koje treba i ne treba raditi pri korištenju QuarkXPressa

10 stvari koje treba i ne treba raditi pri korištenju QuarkXPressa

Kad biste o QuarkXPressu morali odabrati deset lako zaboravljivih, ali iznimno korisnih stvari koje ćete zapamtiti, dragi čitatelju, one na sljedećem popisu bile bi to. Namaste. Razgovarajte sa svojim komercijalnim pisačem Svi projekti ispisa počinju i završavaju s pisačem. To je zato što samo tiskari znaju svoja ograničenja i tisuće načina na koje projekt može biti […]

Porijeklo Bitcoina

Porijeklo Bitcoina

Najvažniji aspekt bitcoina može biti koncept iza njega. Bitcoin je kreirao programer Satoshi Nakamoto. Umjesto da pokušava osmisliti potpuno novi način plaćanja kako bi srušio način na koji svi plaćamo stvari online, Satoshi je uvidio određene probleme s postojećim sustavima plaćanja i htio ih je riješiti. Koncept […]

Kako zaštititi svoju privatnost kada koristite Bitcoin

Kako zaštititi svoju privatnost kada koristite Bitcoin

Određena razina anonimnosti vezana je uz korištenje bitcoina i digitalne valute općenito. Možete li to označiti kao "dovoljno anonimno" osobno je mišljenje. Postoje načini da zaštitite svoju privatnost kada koristite bitcoin za premještanje sredstava, ali oni zahtijevaju malo truda i planiranja: možete generirati novu adresu za […]