Kaip dirbtinis intelektas gali sėkmingai naudoti duomenis

Norint sukurti sėkmingą AI, nepakanka turėti daug duomenų. Šiuo metu AI algoritmas negali išgauti informacijos tiesiogiai iš neapdorotų duomenų. Dauguma algoritmų prieš analizę remiasi išoriniu rinkimu ir manipuliavimu. Kai algoritmas renka naudingą informaciją, jis gali neatspindėti tinkamos informacijos. Ši diskusija padės suprasti, kaip rinkti, valdyti ir automatizuoti duomenų rinkimą iš apžvalgos perspektyvos.

Atsižvelgiant į duomenų šaltinius

Jūsų naudojami duomenys gaunami iš kelių šaltinių. Dažniausias duomenų šaltinis yra informacija, kurią tam tikru momentu įvedė žmonės. Net kai sistema automatiškai renka prekybos svetainės duomenis, žmonės iš pradžių įveda informaciją. Žmogus spusteli įvairias prekes, įdeda jas į pirkinių krepšelį, nurodo charakteristikas (pvz., dydį) ir kiekį, o tada išsiregistruoja. Vėliau, po pardavimo, žmogus įvertina apsipirkimo patirtį, prekę ir pristatymo būdą bei pateikia pastabas. Trumpai tariant, kiekviena apsipirkimo patirtis taip pat tampa duomenų rinkimo užduotimi.

Daugelis duomenų šaltinių šiandien priklauso nuo žmonių šaltinių surinktos informacijos. Žmonės taip pat pateikia rankinį įvestį. Jūs skambinate arba einate į biurą, kad susitartumėte su profesionalu. Tada registratūros darbuotojas surenka iš jūsų informaciją, reikalingą susitikimui. Šie rankiniu būdu surinkti duomenys galiausiai patenka į duomenų rinkinį analizės tikslais.

Duomenys taip pat renkami iš jutiklių, ir šie jutikliai gali būti beveik bet kokios formos. Pavyzdžiui, daugelis organizacijų fizinių duomenų rinkimą, pvz., objektą lange žiūrinčių žmonių skaičių, pagrindžia mobiliojo telefono aptikimu. Veido atpažinimo programinė įranga gali aptikti pasikartojančius klientus.

Tačiau jutikliai gali sukurti duomenų rinkinius beveik iš bet ko. Orų tarnyba remiasi duomenų rinkiniais, sukurtais jutiklių, kurie stebi aplinkos sąlygas, pvz., lietų, temperatūrą, drėgmę, debesuotumą ir pan. Robotų stebėjimo sistemos padeda ištaisyti nedidelius roboto veikimo trūkumus, nuolat analizuodamos stebėjimo jutiklių surinktus duomenis. Jutiklis kartu su maža AI programa gali pasakyti, kada jūsų vakarienė šį vakarą bus iškepta iki tobulumo. Jutiklis renka duomenis, tačiau AI programa naudoja taisykles, padedančias nustatyti, kada maistas tinkamai paruoštas.

Patikimų duomenų gavimas

Žodis patikimas atrodo taip lengvai apibrėžiamas, bet taip sunkiai įgyvendinamas. Kažkas yra patikimas, kai rezultatai yra tikėtini ir nuoseklūs. Patikimas duomenų šaltinis sukuria kasdienius duomenis, kuriuose nėra netikėtumų; nė vienas nėra šokiruotas dėl rezultato. Priklausomai nuo jūsų perspektyvos, iš tikrųjų gali būti gerai, kad dauguma žmonių, peržiūrėdami duomenis, nežiovauja ir neužmiega. Dėl netikėtumų duomenis verta analizuoti ir peržiūrėti. Vadinasi, duomenys turi dvilypumo aspektą. Norime patikimų, kasdieniškų, visiškai numatytų duomenų, kurie tiesiog patvirtintų tai, ką jau žinome, bet netikėtumas yra tai, dėl ko duomenų rinkimas pirmiausia yra naudingas.

Vis dėlto nenorite, kad duomenys būtų tokie neįprasti, kad juos būtų beveik baisu peržiūrėti. Gaunant duomenis reikia išlaikyti pusiausvyrą. Duomenys turi atitikti tam tikras ribas. Ji taip pat turi atitikti konkrečius tiesos vertės kriterijus. Duomenys taip pat turi būti pateikiami numatytais intervalais, o visi gaunamų duomenų įrašo laukai turi būti užpildyti.

Tam tikru mastu duomenų saugumas taip pat turi įtakos duomenų patikimumui. Duomenų nuoseklumas būna kelių formų. Kai gaunami duomenys, galite užtikrinti, kad jie atitiktų numatytus diapazonus ir būtų rodomi tam tikra forma. Tačiau išsaugojus duomenis, patikimumas gali sumažėti, nebent užtikrinsite, kad duomenys išliks norimos formos. Subjektas, besimaišantis su duomenimis, turi įtakos patikimumui, todėl duomenys tampa įtartini ir gali būti netinkami vėliau analizuoti. Duomenų patikimumo užtikrinimas reiškia, kad po to, kai gaunami duomenys, niekas jų nekeičia, kad tilptų į numatomą domeną (dėl to jie tampa kasdieniški).

Žmogaus indėlis tampa patikimesnis

Žmonės daro klaidas – tai yra žmogiškumo dalis. Tiesą sakant, tikėtis, kad žmonės nepadarys klaidų, yra nepagrįsta. Tačiau daugelyje taikomųjų programų daroma prielaida, kad žmonės kažkokiu būdu nepadarys jokių klaidų. Dizainas tikisi, kad visi tiesiog laikysis taisyklių. Deja, didžioji dauguma vartotojų garantuotai net neskaitys taisyklių, nes dauguma žmonių taip pat yra tingūs arba pernelyg spaudžia laiko, kai reikia daryti dalykus, kurie jiems tiesiogiai nepadeda.

Apsvarstykite būsenos įvedimą į formą. Jei pateikiate tik teksto lauką, kai kurie vartotojai gali įvesti visą valstijos pavadinimą, pvz., Kanzasas. Žinoma, kai kurie vartotojai padarys rašybos arba didžiųjų raidžių klaidą ir sugalvos Kansus arba kANSAS. Nustatydami šias klaidas, žmonės ir organizacijos turi įvairių metodų, kaip atlikti užduotis. Kas nors iš leidybos pramonės gali naudoti „Associated Press“ (AP) stiliaus vadovą ir įvesti Kan. Vyresnio amžiaus ir pripratę prie Vyriausybės spausdinimo biuro (GPO) gairių gali įvesti Kans. vietoj to. Naudojami ir kiti sutrumpinimai. JAV paštas (USPS) naudoja KS, o JAV pakrančių apsaugos tarnyba – KA. Tuo tarpu Tarptautinės standartų organizacijos (ISO) forma yra kartu su US-KS. Atminkite, kad tai tik būsenos įrašas, kuris yra gana paprastas – ar taip manėte prieš skaitydami šį skyrių. Aišku,

Išskleidžiamieji sąrašo laukeliai puikiai tinka dideliam duomenų įvesties masyvui, o juos naudojant užtikrinama, kad žmogaus įvestis į tuos laukus taptų itin patikima, nes žmogus neturi kito pasirinkimo, kaip naudoti vieną iš numatytųjų įrašų. Žinoma, žmogus visada gali pasirinkti neteisingą įrašą, todėl atsiranda dvigubas patikrinimas. Kai kurios naujesnės programos lygina pašto kodą su miesto ir valstijos įrašais, kad sužinotų, ar jie atitinka. Kai jie nesutampa, vartotojo vėl prašoma pateikti teisingą įvestį. Šis dvigubas patikrinimas gali būti erzinantis, tačiau vargu ar vartotojas jį matys labai dažnai, todėl jis neturėtų pernelyg erzinti.

Net ir atliekant kryžminius patikrinimus ir statinius įrašus, žmonės vis tiek turi daug galimybių klysti. Pavyzdžiui, gali kilti problemų įvesti skaičius. Kai vartotojas turi įvesti 2.00, galite matyti 2, 2.0, 2. arba bet kurį iš daugelio kitų įrašų. Laimei, išnagrinėjus įrašą ir iš naujo suformatavus problema išspręsta, o šią užduotį galite atlikti automatiškai, be vartotojo pagalbos.

Deja, iš naujo suformatavus klaidingos skaitmeninės įvesties nepavyks ištaisyti. Galite iš dalies sumažinti tokias klaidas įtraukdami diapazono patikras. Klientas negali nusipirkti –5 muilo gabaliukais. Teisėtas būdas parodyti klientui, grąžinančiam muilo gabaliukus, yra grąžinti, o ne parduoti. Tačiau vartotojas galėjo tiesiog padaryti klaidą ir galite pateikti pranešimą, nurodantį tinkamą vertės įvesties diapazoną.

Naudojant automatinį duomenų rinkimą

Kai kurie žmonės mano, kad automatizuotas duomenų rinkimas išsprendžia visas žmogaus įvesties problemas, susijusias su duomenų rinkiniais. Tiesą sakant, automatizuotas duomenų rinkimas suteikia daug privalumų:

  • Geresnė konsistencija
  • Padidėjęs patikimumas
  • Mažesnė duomenų trūkumo tikimybė
  • Padidintas tikslumas
  • Sumažintas dispersija tokiems dalykams kaip laiko įvestis

Deja, teigti, kad automatizuotas duomenų rinkimas išsprendžia kiekvieną problemą, yra tiesiog neteisinga. Automatinis duomenų rinkimas vis dar priklauso nuo žmonių sukurtų jutiklių, programų ir kompiuterių aparatinės įrangos, kuri suteikia prieigą tik prie tų duomenų, kuriuos žmonės nusprendžia leisti. Dėl apribojimų, kuriuos žmonės nustato automatizuoto duomenų rinkimo savybėms, rezultatas dažnai suteikia mažiau naudingos informacijos, nei tikėjosi dizaineriai. Todėl automatizuotas duomenų rinkimas nuolat keičiasi, nes dizaineriai bando išspręsti įvesties problemas.

Automatizuotas duomenų rinkimas taip pat kenčia nuo programinės ir aparatinės įrangos klaidų, esančių bet kurioje kompiuterinėje sistemoje, tačiau gali kilti daugiau minkštųjų problemų (kurios iškyla, kai sistema atrodo veikianti, bet neduoda norimo rezultato) nei kitose kompiuterinėse sistemose. sąrankos. Kai sistema veikia, įvesties patikimumas gerokai viršija žmogaus galimybes. Tačiau, kai kyla problemų, sistema dažnai nesugeba atpažinti, kad problema egzistuoja, kaip gali žmogus, todėl duomenų rinkinyje gali būti daugiau vidutiniškų ar net blogų duomenų.


Senjorams: kaip įterpti iliustraciją į „PowerPoint“ skaidrę

Senjorams: kaip įterpti iliustraciją į „PowerPoint“ skaidrę

Iliustracija yra iš anksto nupieštas bendras meno kūrinys, o „Microsoft“ su „Office“ produktais nemokamai teikia daug iliustracijų failų. Galite įterpti iliustraciją į savo „PowerPoint“ skaidrės maketą. Lengviausias būdas įterpti iliustraciją yra naudoti vieną iš vietos rezervavimo ženklų skaidrės makete: Rodyti skaidrę, kurioje yra iliustracija […]

Senjorams: kaip užpildyti spalvą „Microsoft Excel“.

Senjorams: kaip užpildyti spalvą „Microsoft Excel“.

Užpildymo spalva (dar vadinama šešėliavimu) yra spalva arba raštas, užpildantis vienos ar kelių „Excel“ darbalapio langelių foną. Tamsinimas gali padėti skaitytojo akims sekti informaciją visame puslapyje ir suteikti darbalapiui spalvų bei vizualinio susidomėjimo. Kai kurių tipų skaičiuoklėse, pavyzdžiui, čekių knygelės registre, […]

Akte pridedami nauji kontaktai! 2005 m

Akte pridedami nauji kontaktai! 2005 m

Pačiame paprasčiausiu lygmeniu pagrindinis ACT tikslas! yra vieta, kur saugoti visus kontaktus, su kuriais bendraujate kasdien. Galite įtraukti ir redaguoti visus savo kontaktus iš kontaktinės informacijos lange, nes jame yra visa informacija, susijusi su vienu konkrečiu įrašu ir […]

Nesantaika „LuckyTemplates“ sukčiavimo lapas

Nesantaika „LuckyTemplates“ sukčiavimo lapas

Naudokite šį kodų lapą, kad pradėtumėte naudoti „Discord“. Atraskite naudingų „Discord“ robotų, programų, kurias galite integruoti, ir patarimų, kaip apklausti svečius.

OpenOffice.org, skirtas LuckyTemplates Cheat Sheet

OpenOffice.org, skirtas LuckyTemplates Cheat Sheet

OpenOffice.org biuro rinkinyje yra daug įrankių, palengvinančių darbo gyvenimą. Kai dirbate OpenOffice.org, susipažinkite su funkcijų įrankių juosta (kuri beveik visose programose atrodo vienodai) ir pagrindinius įrankių juostos mygtukus, kad gautumėte pagalbos su pagrindinėmis komandomis atliekant daugumą užduočių.

Alano Turingo bombų mašina

Alano Turingo bombų mašina

Alano Turingo Bombe mašina nebuvo jokia dirbtinio intelekto (AI) forma. Tiesą sakant, tai net nėra tikras kompiuteris. Tai sulaužė Enigma kriptografinius pranešimus, ir viskas. Tačiau tai suteikė Turingui peno apmąstymams, todėl galiausiai buvo parengtas straipsnis „Kompiuterinės mašinos ir intelektas“. kurį jis paskelbė šeštajame dešimtmetyje, kuriame aprašoma […]

Standartiniai dirbtinio intelekto aparatūros trūkumai

Standartiniai dirbtinio intelekto aparatūros trūkumai

Galimybė sukurti modulinę sistemą turi daug naudos, ypač versle. Galimybė pašalinti ir pakeisti atskirus komponentus sumažina sąnaudas ir leidžia laipsniškai pagerinti greitį ir efektyvumą. Tačiau, kaip ir daugumoje dalykų, nemokamų pietų nėra. Von Neumann architektūros teikiamas moduliškumas apima kai kuriuos […]

10 Ką daryti ir ko negalima naudojant QuarkXPress

10 Ką daryti ir ko negalima naudojant QuarkXPress

Jei jums reikėtų pasirinkti dešimt lengvai pamirštamų, bet nepaprastai naudingų dalykų, kuriuos reikia prisiminti apie QuarkXPress, toliau pateiktame sąraše, brangus skaitytojau, jie būtų tokie. Namaste. Pasikalbėkite su savo komerciniu spausdintuvu Visi spausdinimo projektai prasideda ir baigiasi spausdintuvu. Taip yra todėl, kad tik spausdintuvai žino savo apribojimus ir tūkstančius būdų, kaip projektas gali būti įgyvendinamas […]

Bitcoin kilmė

Bitcoin kilmė

Svarbiausias bitkoino aspektas gali būti jo koncepcija. Bitcoin sukūrė kūrėjas Satoshi Nakamoto. Užuot bandęs sukurti visiškai naują mokėjimo metodą, kad būtų panaikintas būdas, kuriuo mes visi mokame už daiktus internetu, Satoshi pastebėjo tam tikras esamų mokėjimo sistemų problemas ir norėjo jas išspręsti. Sąvoka […]

Kaip apsaugoti savo privatumą naudojant Bitcoin

Kaip apsaugoti savo privatumą naudojant Bitcoin

Tam tikras anonimiškumo lygis yra susietas su bitkoinų ir skaitmeninės valiutos naudojimu apskritai. Ar galite tai pažymėti kaip „pakankamai anonimišką“, yra asmeninė nuomonė. Yra būdų apsaugoti savo privatumą naudojant bitkoinus lėšoms perkelti, tačiau tam reikia pastangų ir planavimo: galite sugeneruoti naują adresą […]