Kako umjetna inteligencija može uspješno koristiti podatke

Obilje dostupnih podataka nije dovoljno za stvaranje uspješne umjetne inteligencije. Trenutačno, AI algoritam ne može izvući informacije izravno iz neobrađenih podataka. Većina algoritama se oslanja na vanjsko prikupljanje i manipulaciju prije analize. Kada algoritam prikuplja korisne informacije, možda neće predstavljati prave informacije. Sljedeća rasprava pomaže vam razumjeti kako prikupljati, manipulirati i automatizirati prikupljanje podataka iz perspektive pregleda.

S obzirom na izvore podataka

Podaci koje koristite dolaze iz brojnih izvora. Najčešći izvor podataka je iz informacija koje su ljudi unijeli u nekom trenutku. Čak i kada sustav automatski prikuplja podatke s web-mjesta za kupovinu, ljudi u početku unose informacije. Čovjek klikne razne artikle, dodaje ih u košaricu, specificira karakteristike (kao što je veličina) i količinu, a zatim odjavljuje. Kasnije, nakon prodaje, čovjek daje ocjenu iskustvu kupnje, proizvodu i načinu isporuke i daje komentare. Ukratko, svako kupovno iskustvo postaje i vježba prikupljanja podataka.

Mnogi izvori podataka danas se oslanjaju na podatke prikupljene iz ljudskih izvora. Ljudi također pružaju ručni unos. Nazovete ili idete negdje u ured kako biste dogovorili sastanak sa stručnjakom. Recepcionar tada od vas prikuplja informacije koje su potrebne za termin. Ovi ručno prikupljeni podaci na kraju završavaju u skupu podataka negdje za potrebe analize.

Podaci se također prikupljaju od senzora, a ti senzori mogu imati gotovo bilo koji oblik. Na primjer, mnoge organizacije temelje prikupljanje fizičkih podataka, kao što je broj ljudi koji gledaju objekt u prozoru, na detekciji mobilnog telefona. Softver za prepoznavanje lica potencijalno bi mogao otkriti ponovne kupce.

Međutim, senzori mogu stvoriti skupove podataka iz gotovo svega. Meteorološka služba oslanja se na skupove podataka koje stvaraju senzori koji prate okolišne uvjete kao što su kiša, temperatura, vlažnost, naoblaka i tako dalje. Robotski nadzorni sustavi pomažu u ispravljanju malih nedostataka u robotskom radu konstantnom analizom podataka koje prikupljaju senzori za nadzor. Senzor, u kombinaciji s malom AI aplikacijom, mogao bi vam reći kada je vaša večera kuhana do savršenstva večeras. Senzor prikuplja podatke, ali AI aplikacija koristi pravila koja pomažu definirati kada je hrana pravilno kuhana.

Dobivanje pouzdanih podataka

Čini se da je riječ pouzdano tako lako definirati, ali tako teško implementirati. Nešto je pouzdano kada su rezultati koje proizvodi očekivani i dosljedni. Pouzdan izvor podataka proizvodi svjetovne podatke koji ne sadrže iznenađenja; nitko nije ni najmanje šokiran ishodom. Ovisno o vašoj perspektivi, zapravo bi moglo biti dobro da većina ljudi ne zijeva, a zatim ne zaspi dok pregledava podatke. Iznenađenja čine podatke vrijednima analiziranja i pregleda. Prema tome, podaci imaju aspekt dualnosti. Želimo pouzdane, svakodnevne, potpuno očekivane podatke koji jednostavno potvrđuju ono što već znamo, ali neočekivano je ono što prikupljanje podataka čini korisnim prije svega.

Ipak, ne želite podatke koji su toliko neuobičajeni da postaje gotovo zastrašujuće pregledati. Prilikom dobivanja podataka potrebno je održavati ravnotežu. Podaci se moraju uklopiti u određene granice. Također mora zadovoljiti posebne kriterije u pogledu istinitosti vrijednosti. Podaci također moraju dolaziti u očekivanim intervalima, a sva polja ulaznog zapisa podataka moraju biti popunjena.

Sigurnost podataka u određenoj mjeri utječe i na pouzdanost podataka. Dosljednost podataka dolazi u nekoliko oblika. Kada podaci stignu, možete osigurati da su u očekivanim rasponima i da se pojavljuju u određenom obliku. Međutim, nakon što pohranite podatke, pouzdanost se može smanjiti osim ako ne osigurate da podaci ostanu u očekivanom obliku. Entitet koji petlja s podacima utječe na pouzdanost, čineći podatke sumnjivim i potencijalno neupotrebljivim za kasniju analizu. Osiguravanje pouzdanosti podataka znači da nakon što podaci stignu, nitko ih ne mijenja kako bi se uklopili u očekivanu domenu (što ih kao rezultat čini svakodnevnim).

Učiniti ljudski unos pouzdanijim

Ljudi griješe - to je dio ljudskog bića. Zapravo, nerazumno je očekivati ​​da ljudi neće pogriješiti. Ipak, mnogi dizajni aplikacija pretpostavljaju da ljudi nekako neće pogriješiti bilo koje vrste. Dizajn očekuje da će svi jednostavno slijediti pravila. Nažalost, velika većina korisnika zajamčeno neće ni pročitati pravila jer je većina ljudi također lijena ili previše pritisnuta kada je riječ o stvarima koje im zapravo ne pomažu izravno.

Razmotrimo ulazak države u formu. Ako navedete samo tekstualno polje, neki korisnici mogu unijeti cijeli naziv države, kao što je Kansas. Naravno, neki korisnici će napraviti pogrešku pri pisanju ili pisanju velikih slova i smisliti Kansus ili kANSAS. Postavljajući ove pogreške, ljudi i organizacije imaju različite pristupe izvršavanju zadataka. Netko u izdavačkoj industriji mogao bi koristiti stilski vodič Associated Pressa (AP) i unijeti Kan. Netko tko je stariji i navikao se na smjernice Vladinog tiskarskog ureda (GPO) mogao bi unijeti Kans. umjesto toga. Koriste se i druge kratice. Američka pošta (USPS) koristi KS, ali američka obalna straža koristi KA. U međuvremenu, obrazac Međunarodne organizacije za standardizaciju (ISO) ide uz US-KS. Imajte na umu, ovo je samo unos stanja, koji je prilično jednostavan - ili ste barem tako mislili prije čitanja ovog odjeljka. Jasno,

Okviri s padajućim popisima dobro funkcioniraju za nevjerojatan niz unosa podataka, a njihova upotreba osigurava da ljudski unos u ta polja postane iznimno pouzdan jer čovjek nema izbora nego koristiti jedan od zadanih unosa. Naravno, čovjek uvijek može odabrati netočan unos, a tu dolazi do dvostruke provjere. Neke novije aplikacije uspoređuju poštanski broj s unosima grada i države kako bi vidjeli odgovaraju li. Kada se ne podudaraju, od korisnika se ponovno traži da unese točan unos. Ova dvostruka provjera graniči s time da je dosadna, ali malo je vjerojatno da će je korisnik vidjeti često, pa ne bi trebala postati previše neugodna.

Čak i uz unakrsne provjere i statične unose, ljudi još uvijek imaju puno prostora za pogreške. Na primjer, unos brojeva može biti problematičan. Kada korisnik treba unijeti 2.00, možda ćete vidjeti 2, ili 2.0, ili 2., ili bilo koji od niza drugih unosa. Na sreću, raščlanjivanje unosa i njegovo ponovno formatiranje riješit će problem, a ovaj zadatak možete izvršiti automatski, bez pomoći korisnika.

Nažalost, preformatiranje neće ispraviti pogrešan brojčani unos. Takve pogreške možete djelomično ublažiti uključivanjem provjera raspona. Kupac ne može kupiti –5 sapuna. Legitiman način da se pokaže kupcu koji vraća komade sapuna je obrada povrata, a ne prodaje. Međutim, korisnik je možda jednostavno napravio pogrešku, a vi možete dati poruku u kojoj se navodi ispravan raspon unosa za vrijednost.

Korištenje automatiziranog prikupljanja podataka

Neki ljudi misle da automatizirano prikupljanje podataka rješava sve probleme ljudskog unosa povezane sa skupovima podataka. Zapravo, automatsko prikupljanje podataka pruža niz prednosti:

  • Bolja konzistencija
  • Poboljšana pouzdanost
  • Manja vjerojatnost da podaci nedostaju
  • Povećana točnost
  • Smanjena varijacija za stvari poput vremenskih unosa

Nažalost, reći da automatizirano prikupljanje podataka rješava svaki problem jednostavno je netočno. Automatizirano prikupljanje podataka i dalje se oslanja na senzore, aplikacije i računalni hardver koji su dizajnirali ljudi koji pružaju pristup samo podacima koje ljudi odluče dopustiti. Zbog ograničenja koja ljudi postavljaju na karakteristike automatiziranog prikupljanja podataka, rezultat često pruža manje korisne informacije nego što su se nadali dizajneri. Posljedično, automatizirano prikupljanje podataka je u stalnom fluktuaciji dok dizajneri pokušavaju riješiti probleme s unosom.

Automatizirano prikupljanje podataka također pati od softverskih i hardverskih grešaka prisutnih u bilo kojem računskom sustavu, ali s većim potencijalom za soft probleme (koji nastaju kada sustav naizgled radi, ali ne daje željeni rezultat) od drugih vrsta računalnih sustava postavke. Kada sustav radi, pouzdanost unosa daleko premašuje ljudske sposobnosti. Međutim, kada se pojave blagi problemi, sustav često ne prepoznaje da problem postoji, kao što bi čovjek mogao, pa bi stoga skup podataka mogao na kraju sadržavati osrednje ili čak loše podatke.


Za starije osobe: Kako umetnuti isječak u PowerPoint slajd

Za starije osobe: Kako umetnuti isječak u PowerPoint slajd

Clip art je unaprijed nacrtana generička umjetnička djela, a Microsoft uz svoje proizvode sustava Office besplatno nudi mnoge datoteke s isječcima. Možete umetnuti isječke u svoj PowerPoint raspored slajda. Najlakši način za umetanje isječaka je korištenje jednog od rezerviranih mjesta na rasporedu slajda: Prikažite slajd koji sadrži isječak […]

Za starije: Kako ispuniti boju u Microsoft Excelu

Za starije: Kako ispuniti boju u Microsoft Excelu

Boja ispune — također se naziva sjenčanje — boja je ili uzorak koji ispunjava pozadinu jedne ili više ćelija radnog lista programa Excel. Primjena sjenčanja može pomoći očima čitatelja da prate informacije na stranici i može dodati boju i vizualni interes radnom listu. U nekim vrstama proračunskih tablica, kao što je registar čekovne knjižice, […]

Dodavanje novih kontakata u Zakon! 2005

Dodavanje novih kontakata u Zakon! 2005

Na najjednostavnijoj razini, glavna svrha ACT-a! služi kao mjesto za pohranu svih kontakata s kojima svakodnevno komunicirate. Možete dodavati i uređivati ​​sve svoje kontakte iz prozora s pojedinostima o kontaktu jer sadrži sve informacije koje se odnose na jedan određeni zapis i […]

Discord For LuckyTemplates Cheat Sheet

Discord For LuckyTemplates Cheat Sheet

Upotrijebite ovaj Cheat Sheet kako biste odmah uskočili u korištenje Discorda. Otkrijte korisne Discord botove, aplikacije koje možete integrirati i savjete za intervjuiranje gostiju.

OpenOffice.org za LuckyTemplates Cheat Sheet

OpenOffice.org za LuckyTemplates Cheat Sheet

Uredski paket OpenOffice.org ima mnogo alata koji olakšavaju radni život. Kada radite u OpenOffice.org, upoznajte funkcijsku alatnu traku (koja izgleda prilično isto u svim aplikacijama) i glavne gumbe alatne trake za pomoć s osnovnim naredbama za većinu zadataka.

Stroj za bombe Alana Turinga

Stroj za bombe Alana Turinga

Stroj Bombe Alana Turinga nije bio nikakav oblik umjetne inteligencije (AI). Zapravo, to čak i nije pravo računalo. Razbio je kriptografske poruke Enigme, i to je to. Međutim, to je Turingu pružilo hranu za razmišljanje, što je na kraju dovelo do rada pod naslovom “Computing Machinery and Intelligenceâ€?? koju je objavio 1950-ih koja opisuje […]

Standardni hardverski nedostaci za umjetnu inteligenciju

Standardni hardverski nedostaci za umjetnu inteligenciju

Mogućnost stvaranja modularnog sustava ima značajne prednosti, posebno u poslovanju. Mogućnost uklanjanja i zamjene pojedinačnih komponenti održava troškove niskim, a istovremeno dopušta postepena poboljšanja i brzine i učinkovitosti. Međutim, kao i kod većine stvari, nema besplatnog ručka. Modularnost koju pruža Von Neumannova arhitektura dolazi s nekim […]

10 stvari koje treba i ne treba raditi pri korištenju QuarkXPressa

10 stvari koje treba i ne treba raditi pri korištenju QuarkXPressa

Kad biste o QuarkXPressu morali odabrati deset lako zaboravljivih, ali iznimno korisnih stvari koje ćete zapamtiti, dragi čitatelju, one na sljedećem popisu bile bi to. Namaste. Razgovarajte sa svojim komercijalnim pisačem Svi projekti ispisa počinju i završavaju s pisačem. To je zato što samo tiskari znaju svoja ograničenja i tisuće načina na koje projekt može biti […]

Porijeklo Bitcoina

Porijeklo Bitcoina

Najvažniji aspekt bitcoina može biti koncept iza njega. Bitcoin je kreirao programer Satoshi Nakamoto. Umjesto da pokušava osmisliti potpuno novi način plaćanja kako bi srušio način na koji svi plaćamo stvari online, Satoshi je uvidio određene probleme s postojećim sustavima plaćanja i htio ih je riješiti. Koncept […]

Kako zaštititi svoju privatnost kada koristite Bitcoin

Kako zaštititi svoju privatnost kada koristite Bitcoin

Određena razina anonimnosti vezana je uz korištenje bitcoina i digitalne valute općenito. Možete li to označiti kao "dovoljno anonimno" osobno je mišljenje. Postoje načini da zaštitite svoju privatnost kada koristite bitcoin za premještanje sredstava, ali oni zahtijevaju malo truda i planiranja: možete generirati novu adresu za […]