Kuinka tekoäly voi käyttää dataa menestyksekkäästi

Menestyneen tekoälyn luomiseen ei riitä, että käytettävissä on runsaasti dataa. Tällä hetkellä tekoälyalgoritmi ei voi poimia tietoja suoraan raakatiedoista. Useimmat algoritmit luottavat ulkoiseen keräämiseen ja manipulointiin ennen analyysiä. Kun algoritmi kerää hyödyllistä tietoa, se ei välttämättä edusta oikeaa tietoa. Seuraava keskustelu auttaa ymmärtämään, kuinka tiedonkeruuta voidaan kerätä, käsitellä ja automatisoida yleiskatsauksen näkökulmasta.

Ottaen huomioon tietolähteet

Käyttämäsi tiedot ovat peräisin useista lähteistä. Yleisin tietolähde on ihmisten jossain vaiheessa syöttämästä tiedosta. Vaikka järjestelmä kerää ostossivuston tiedot automaattisesti, ihmiset syöttävät tiedot ensin. Ihminen napsauttaa erilaisia tuotteita, lisää ne ostoskoriin, määrittelee ominaisuudet (kuten koon) ja määrän ja suorittaa sitten kassan. Myöhemmin, myynnin jälkeen, ihminen antaa ostokokemukselle, tuotteelle ja toimitustavalle arvosanan ja kommentoi. Lyhyesti sanottuna jokaisesta ostokokemuksesta tulee myös tiedonkeruuharjoitus.

Monet tietolähteet perustuvat nykyään ihmislähteistä kerättyyn tietoon. Ihminen syöttää myös manuaalisesti. Soitat tai menet jonnekin toimistoon sopiaksesi ajan ammattilaisen kanssa. Vastaanottovirkailija kerää sitten sinulta tiedot, joita tarvitaan tapaamista varten. Nämä manuaalisesti kerätyt tiedot päätyvät lopulta tietojoukkoon analyysitarkoituksiin.

Tietoja kerätään myös antureilta, ja nämä anturit voivat olla melkein minkä muotoisia tahansa. Esimerkiksi monet organisaatiot perustavat fyysisen tiedonkeruun, kuten ikkunassa objektia katselevien ihmisten määrän, matkapuhelimen havaitsemiseen. Kasvojentunnistusohjelmisto voi mahdollisesti havaita toistuvia asiakkaita.

Anturit voivat kuitenkin luoda tietojoukkoja melkein mistä tahansa. Sääpalvelu luottaa antureiden luomiin tietokokonaisuuksiin, jotka tarkkailevat ympäristöolosuhteita, kuten sadetta, lämpötilaa, kosteutta, pilvisyyttä ja niin edelleen. Robottivalvontajärjestelmät auttavat korjaamaan pieniä virheitä robotin toiminnassa analysoimalla jatkuvasti valvonta-anturien keräämiä tietoja. Anturi yhdistettynä pieneen tekoälysovellukseen voi kertoa sinulle, milloin illallinen on kypsennetty täydellisesti tänä iltana. Anturi kerää tietoa, mutta tekoälysovellus käyttää sääntöjä, jotka auttavat määrittämään, milloin ruoka on kypsennetty oikein.

Luotettavan tiedon hankkiminen

Sana luotettava vaikuttaa niin helposti määriteltävältä, mutta silti niin vaikealta toteuttaa. Jokin on luotettava, kun sen tuottamat tulokset ovat sekä odotettuja että johdonmukaisia. Luotettava tietolähde tuottaa arkipäiväistä dataa, joka ei sisällä yllätyksiä; kukaan ei ole vähiten järkyttynyt tuloksesta. Näkökulmastasi riippuen voi olla hyvä asia, että useimmat ihmiset eivät haukota ja nukahda tietoja tarkastellessaan. Yllätykset tekevät tiedosta analysoinnin ja tarkastelun arvoista. Näin ollen tiedoilla on kaksinaisuus. Haluamme luotettavia, arkipäiväisiä, täysin ennakoituja tietoja, jotka vain vahvistavat sen, mitä jo tiedämme, mutta odottamattomuus tekee tiedon keräämisestä ennen kaikkea hyödyllistä.

Et kuitenkaan halua dataa, joka on niin poikkeavaa, että sen tarkastelu on lähes pelottavaa. Tasapainoa on pidettävä yllä tietoja hankittaessa. Tietojen tulee mahtua tiettyihin rajoihin. Sen on myös täytettävä tietyt kriteerit totuusarvon suhteen. Tietojen tulee myös tulla odotetuin aikavälein, ja saapuvan tietueen kaikkien kenttien on oltava täytettyinä.

Tietoturva vaikuttaa jossain määrin myös tietojen luotettavuuteen. Tietojen yhtenäisyys on useissa muodoissa. Kun tiedot saapuvat, voit varmistaa, että ne ovat odotettujen rajojen sisällä ja näkyvät tietyssä muodossa. Tietojen tallentamisen jälkeen luotettavuus voi kuitenkin laskea, ellet varmista, että tiedot pysyvät odotetussa muodossa. Tiedon parissa puuhaileva kokonaisuus vaikuttaa luotettavuuteen, jolloin tiedoista tulee epäilyttäviä ja mahdollisesti käyttökelvottomia myöhempää analysointia varten. Tietojen luotettavuuden varmistaminen tarkoittaa, että tietojen saapumisen jälkeen kukaan ei peukaloi niitä saadakseen ne sopimaan odotettuun verkkotunnukseen (jolloin siitä tulee arkipäiväinen).

Ihmisten panoksesta tulee luotettavampi

Ihminen tekee virheitä – se on osa ihmisenä olemista. Itse asiassa on kohtuutonta odottaa, että ihmiset eivät tekisi virheitä. Silti monet sovellusmallit olettavat, että ihmiset eivät jotenkin tee minkäänlaisia virheitä. Suunnittelu edellyttää, että kaikki vain noudattavat sääntöjä. Valitettavasti suurin osa käyttäjistä ei taatusti edes lue sääntöjä, koska useimmat ihmiset ovat myös laiskoja tai liian kiireisiä tehdäkseen asioita, jotka eivät todellakaan auta heitä suoraan.

Harkitse tilan tuloa muotoon. Jos annat vain tekstikentän, jotkut käyttäjät voivat syöttää koko osavaltion nimen, kuten Kansas. Tietenkin jotkut käyttäjät tekevät kirjoitusvirheen tai isot kirjaimet ja keksivät Kansas tai kANSAS. Asettamalla näitä virheitä ihmisillä ja organisaatioilla on erilaisia lähestymistapoja tehtävien suorittamiseen. Joku kustantamo voi käyttää Associated Pressin (AP) tyyliopasta ja syöttää Kanin. Joku vanhempi ja GPO:n ohjeisiin tottunut voi syöttää Kansin. sen sijaan. Myös muita lyhenteitä käytetään. US Post Office (USPS) käyttää KS:ää, mutta Yhdysvaltain rannikkovartiosto käyttää KA:ta. Samaan aikaan Kansainvälisen standardointijärjestön (ISO) lomake menee US-KS:n kanssa. Huomaa, että tämä on vain tilamerkintä, joka on melko yksinkertaista - tai niin luulit ennen tämän osion lukemista. Selvästi,

Avattavat luetteloruudut toimivat hyvin hämmästyttävän joukon tietosyötteitä varten, ja niiden käyttäminen varmistaa, että ihmisten syöttämisestä näihin kenttiin tulee erittäin luotettava, koska ihmisellä ei ole muuta vaihtoehtoa kuin käyttää jotakin oletusarvoista. Ihminen voi tietysti aina valita väärän merkinnän, jolloin kaksoistarkistukset tulevat voimaan. Jotkut uudemmat sovellukset vertaavat postinumeroa kaupunki- ja osavaltiomerkintöihin nähdäkseen, vastaavatko ne. Jos ne eivät täsmää, käyttäjää pyydetään uudelleen antamaan oikea syöte. Tämä kaksoistarkistus saattaa olla ärsyttävää, mutta käyttäjä ei todennäköisesti näe sitä kovin usein, joten sen ei pitäisi tulla liian ärsyttävää.

Jopa ristiintarkistuksissa ja staattisissa merkinnöissä ihmisillä on edelleen runsaasti tilaa tehdä virheitä. Esimerkiksi numeroiden syöttäminen voi olla ongelmallista. Kun käyttäjän on syötettävä 2.00, saatat nähdä 2, 2.0 tai 2. tai minkä tahansa useista muista tiedoista. Onneksi merkinnän jäsentäminen ja uudelleenalustaminen korjaa ongelman, ja voit suorittaa tämän tehtävän automaattisesti ilman käyttäjän apua.

Valitettavasti uudelleenalustaminen ei korjaa virheellistä numeerista syöttöä. Voit osittain lieventää tällaisia virheitä sisällyttämällä etäisyystarkistukset. Asiakas ei voi ostaa –5 palaa saippuaa. Laillinen tapa näyttää asiakkaalle, että hän palauttaa saippuapalat, on käsitellä palautus, ei myynti. Käyttäjä on kuitenkin voinut yksinkertaisesti tehdä virheen, ja voit antaa viestin, jossa ilmoitetaan arvolle oikea syöttöalue.

Automaattisen tiedonkeruun käyttö

Jotkut ihmiset ajattelevat, että automaattinen tiedonkeruu ratkaisee kaikki tietojoukkoon liittyvät ihmisten syötteisiin liittyvät ongelmat. Itse asiassa automaattinen tiedonkeruu tarjoaa useita etuja:

Parempi johdonmukaisuus
Parempi luotettavuus
Pienempi puuttuvien tietojen todennäköisyys
Parannettu tarkkuus
Pienempi varianssi esimerkiksi ajoitetuille tuloille

Valitettavasti on yksinkertaisesti väärin väittää, että automaattinen tiedonkeruu ratkaisee kaikki ongelmat. Automaattinen tiedonkeruu perustuu edelleen ihmisten suunnittelemiin antureisiin, sovelluksiin ja tietokonelaitteistoihin, jotka tarjoavat pääsyn vain niihin tietoihin, jotka ihmiset päättävät sallia. Koska ihmiset asettavat automaattisen tiedonkeruun ominaisuuksille rajoituksia, tulos tarjoaa usein vähemmän hyödyllistä tietoa kuin suunnittelijat toivovat. Tämän seurauksena automaattinen tiedonkeruu on jatkuvassa muutoksessa, kun suunnittelijat yrittävät ratkaista syöttöongelmia.

Automaattinen tiedonkeruu kärsii myös ohjelmisto- ja laitteistovirheistä, joita esiintyy kaikissa tietokonejärjestelmissä, mutta joissa on suurempi mahdollisuus pehmeisiin ongelmiin (jotka syntyvät, kun järjestelmä näyttää toimivan, mutta ei tuota toivottua tulosta) kuin muissa tietokonepohjaisissa järjestelmissä. asetukset. Kun järjestelmä toimii, syötteen luotettavuus ylittää paljon ihmisen kyvyt. Pehmeiden ongelmien ilmetessä järjestelmä ei kuitenkaan usein tunnista ongelman olemassaoloa, kuten ihminen voi, ja siksi aineisto voi päätyä sisältämään keskinkertaista tai jopa huonompaa dataa.

Jätä kommentti

Snagit 2018 Review Mitä uutta version 13 jälkeen

TechSmith Snagit on suosikki kuvakaappaus- ja kuvankäsittelyohjelmistomme. Tutustu Snagit 2018:n uusiin ominaisuuksiin!

8 Online-työkalua kaavioiden ja vuokaavioiden piirtämiseen

Haluatko luoda kaavioita tai vuokaavioita etkä halua asentaa ylimääräisiä ohjelmistoja? Tässä on luettelo online-kaavion työkaluista.

Spotify ei voi toistaa nykyistä kappaletta? Kuinka korjata

Talo täynnä langattomasti yhdistettyjä laitteita ja suoratoistopalveluita, kuten Spotify, on hienoa, kunnes asiat eivät toimi ja löydät mielenkiintoisia ratkaisuja.

Mikä on NVMe M.2 SSD ja kuinka nopea se on?

NVMe M.2 SSD on uusin tietokoneen kiintolevyteknologia. Mikä se on ja kuinka nopea se on verrattuna vanhoihin kiintolevyihin ja SSD-levyihin?

Sonos vs. AirPlay: Miksi valitsin AirPlayn Whole House Audiolle

Sonos on juuri toimiva äänentoistoratkaisu alkaen 400 dollarista kahdelle kaiuttimelle. Mutta oikealla asetuksella AirPlay voi olla ilmaista. Tarkastellaan yksityiskohtia.

Google Backup and Sync -sovellus korvaa valokuvat ja Driven

Google Backup and Sync on uusi sovellus, joka synkronoidaan Kuviin ja Driveen. Lue eteenpäin nähdäksesi, kuinka se kohtaa OneDriven, Dropboxin, Backblazen ja Crashplanin.

Johdon katkaisu: MyIPTV:n tarkistus SOPlayerin kanssa

MyIPTV on kaapelin katkaisupalvelu, joka käyttää SOPlayer-sovellusta useille alustoille ja tarjoaa televisiota, elokuvia ja muita mediamuotoja maksulliseen

Logitechin valaistu olohuoneen näppäimistö K830

Logitech julkaisi äskettäin valaistun olohuoneen näppäimistönsä K830:n, joka on tarkoitettu kodin viihdekumppaniksi. Tässä arviomme yksiköstä.

CloudHQ päivitetty: Nopeampi synkronointi, muokkaa Dropbox-tiedostoja Google-dokumenteista

Tässä on katsaus CloudHQ:lle hiljattain julkaistuun päivitykseen ja sen toimintaan. Lue lisää saadaksesi lisätietoja.

Mikä on OnePlus 6T Android -puhelin?

OnePlus 6T on huippuluokan lippulaivalaatuinen Android-puhelin, joka myydään alennettuun hintaan verrattuna Apple iPhoneen, Google Pixel 3:een tai Samsung Galaxy S9:ään.