Kaip dirbtinis intelektas gali sėkmingai naudoti duomenis

Norint sukurti sėkmingą AI, nepakanka turėti daug duomenų. Šiuo metu AI algoritmas negali išgauti informacijos tiesiogiai iš neapdorotų duomenų. Dauguma algoritmų prieš analizę remiasi išoriniu rinkimu ir manipuliavimu. Kai algoritmas renka naudingą informaciją, jis gali neatspindėti tinkamos informacijos. Ši diskusija padės suprasti, kaip rinkti, valdyti ir automatizuoti duomenų rinkimą iš apžvalgos perspektyvos.

Atsižvelgiant į duomenų šaltinius

Jūsų naudojami duomenys gaunami iš kelių šaltinių. Dažniausias duomenų šaltinis yra informacija, kurią tam tikru momentu įvedė žmonės. Net kai sistema automatiškai renka prekybos svetainės duomenis, žmonės iš pradžių įveda informaciją. Žmogus spusteli įvairias prekes, įdeda jas į pirkinių krepšelį, nurodo charakteristikas (pvz., dydį) ir kiekį, o tada išsiregistruoja. Vėliau, po pardavimo, žmogus įvertina apsipirkimo patirtį, prekę ir pristatymo būdą bei pateikia pastabas. Trumpai tariant, kiekviena apsipirkimo patirtis taip pat tampa duomenų rinkimo užduotimi.

Daugelis duomenų šaltinių šiandien priklauso nuo žmonių šaltinių surinktos informacijos. Žmonės taip pat pateikia rankinį įvestį. Jūs skambinate arba einate į biurą, kad susitartumėte su profesionalu. Tada registratūros darbuotojas surenka iš jūsų informaciją, reikalingą susitikimui. Šie rankiniu būdu surinkti duomenys galiausiai patenka į duomenų rinkinį analizės tikslais.

Duomenys taip pat renkami iš jutiklių, ir šie jutikliai gali būti beveik bet kokios formos. Pavyzdžiui, daugelis organizacijų fizinių duomenų rinkimą, pvz., objektą lange žiūrinčių žmonių skaičių, pagrindžia mobiliojo telefono aptikimu. Veido atpažinimo programinė įranga gali aptikti pasikartojančius klientus.

Tačiau jutikliai gali sukurti duomenų rinkinius beveik iš bet ko. Orų tarnyba remiasi duomenų rinkiniais, sukurtais jutiklių, kurie stebi aplinkos sąlygas, pvz., lietų, temperatūrą, drėgmę, debesuotumą ir pan. Robotų stebėjimo sistemos padeda ištaisyti nedidelius roboto veikimo trūkumus, nuolat analizuodamos stebėjimo jutiklių surinktus duomenis. Jutiklis kartu su maža AI programa gali pasakyti, kada jūsų vakarienė šį vakarą bus iškepta iki tobulumo. Jutiklis renka duomenis, tačiau AI programa naudoja taisykles, padedančias nustatyti, kada maistas tinkamai paruoštas.

Patikimų duomenų gavimas

Žodis patikimas atrodo taip lengvai apibrėžiamas, bet taip sunkiai įgyvendinamas. Kažkas yra patikimas, kai rezultatai yra tikėtini ir nuoseklūs. Patikimas duomenų šaltinis sukuria kasdienius duomenis, kuriuose nėra netikėtumų; nė vienas nėra šokiruotas dėl rezultato. Priklausomai nuo jūsų perspektyvos, iš tikrųjų gali būti gerai, kad dauguma žmonių, peržiūrėdami duomenis, nežiovauja ir neužmiega. Dėl netikėtumų duomenis verta analizuoti ir peržiūrėti. Vadinasi, duomenys turi dvilypumo aspektą. Norime patikimų, kasdieniškų, visiškai numatytų duomenų, kurie tiesiog patvirtintų tai, ką jau žinome, bet netikėtumas yra tai, dėl ko duomenų rinkimas pirmiausia yra naudingas.

Vis dėlto nenorite, kad duomenys būtų tokie neįprasti, kad juos būtų beveik baisu peržiūrėti. Gaunant duomenis reikia išlaikyti pusiausvyrą. Duomenys turi atitikti tam tikras ribas. Ji taip pat turi atitikti konkrečius tiesos vertės kriterijus. Duomenys taip pat turi būti pateikiami numatytais intervalais, o visi gaunamų duomenų įrašo laukai turi būti užpildyti.

Tam tikru mastu duomenų saugumas taip pat turi įtakos duomenų patikimumui. Duomenų nuoseklumas būna kelių formų. Kai gaunami duomenys, galite užtikrinti, kad jie atitiktų numatytus diapazonus ir būtų rodomi tam tikra forma. Tačiau išsaugojus duomenis, patikimumas gali sumažėti, nebent užtikrinsite, kad duomenys išliks norimos formos. Subjektas, besimaišantis su duomenimis, turi įtakos patikimumui, todėl duomenys tampa įtartini ir gali būti netinkami vėliau analizuoti. Duomenų patikimumo užtikrinimas reiškia, kad po to, kai gaunami duomenys, niekas jų nekeičia, kad tilptų į numatomą domeną (dėl to jie tampa kasdieniški).

Žmogaus indėlis tampa patikimesnis

Žmonės daro klaidas – tai yra žmogiškumo dalis. Tiesą sakant, tikėtis, kad žmonės nepadarys klaidų, yra nepagrįsta. Tačiau daugelyje taikomųjų programų daroma prielaida, kad žmonės kažkokiu būdu nepadarys jokių klaidų. Dizainas tikisi, kad visi tiesiog laikysis taisyklių. Deja, didžioji dauguma vartotojų garantuotai net neskaitys taisyklių, nes dauguma žmonių taip pat yra tingūs arba pernelyg spaudžia laiko, kai reikia daryti dalykus, kurie jiems tiesiogiai nepadeda.

Apsvarstykite būsenos įvedimą į formą. Jei pateikiate tik teksto lauką, kai kurie vartotojai gali įvesti visą valstijos pavadinimą, pvz., Kanzasas. Žinoma, kai kurie vartotojai padarys rašybos arba didžiųjų raidžių klaidą ir sugalvos Kansus arba kANSAS. Nustatydami šias klaidas, žmonės ir organizacijos turi įvairių metodų, kaip atlikti užduotis. Kas nors iš leidybos pramonės gali naudoti „Associated Press“ (AP) stiliaus vadovą ir įvesti Kan. Vyresnio amžiaus ir pripratę prie Vyriausybės spausdinimo biuro (GPO) gairių gali įvesti Kans. vietoj to. Naudojami ir kiti sutrumpinimai. JAV paštas (USPS) naudoja KS, o JAV pakrančių apsaugos tarnyba – KA. Tuo tarpu Tarptautinės standartų organizacijos (ISO) forma yra kartu su US-KS. Atminkite, kad tai tik būsenos įrašas, kuris yra gana paprastas – ar taip manėte prieš skaitydami šį skyrių. Aišku,

Išskleidžiamieji sąrašo laukeliai puikiai tinka dideliam duomenų įvesties masyvui, o juos naudojant užtikrinama, kad žmogaus įvestis į tuos laukus taptų itin patikima, nes žmogus neturi kito pasirinkimo, kaip naudoti vieną iš numatytųjų įrašų. Žinoma, žmogus visada gali pasirinkti neteisingą įrašą, todėl atsiranda dvigubas patikrinimas. Kai kurios naujesnės programos lygina pašto kodą su miesto ir valstijos įrašais, kad sužinotų, ar jie atitinka. Kai jie nesutampa, vartotojo vėl prašoma pateikti teisingą įvestį. Šis dvigubas patikrinimas gali būti erzinantis, tačiau vargu ar vartotojas jį matys labai dažnai, todėl jis neturėtų pernelyg erzinti.

Net ir atliekant kryžminius patikrinimus ir statinius įrašus, žmonės vis tiek turi daug galimybių klysti. Pavyzdžiui, gali kilti problemų įvesti skaičius. Kai vartotojas turi įvesti 2.00, galite matyti 2, 2.0, 2. arba bet kurį iš daugelio kitų įrašų. Laimei, išnagrinėjus įrašą ir iš naujo suformatavus problema išspręsta, o šią užduotį galite atlikti automatiškai, be vartotojo pagalbos.

Deja, iš naujo suformatavus klaidingos skaitmeninės įvesties nepavyks ištaisyti. Galite iš dalies sumažinti tokias klaidas įtraukdami diapazono patikras. Klientas negali nusipirkti –5 muilo gabaliukais. Teisėtas būdas parodyti klientui, grąžinančiam muilo gabaliukus, yra grąžinti, o ne parduoti. Tačiau vartotojas galėjo tiesiog padaryti klaidą ir galite pateikti pranešimą, nurodantį tinkamą vertės įvesties diapazoną.

Naudojant automatinį duomenų rinkimą

Kai kurie žmonės mano, kad automatizuotas duomenų rinkimas išsprendžia visas žmogaus įvesties problemas, susijusias su duomenų rinkiniais. Tiesą sakant, automatizuotas duomenų rinkimas suteikia daug privalumų:

Geresnė konsistencija
Padidėjęs patikimumas
Mažesnė duomenų trūkumo tikimybė
Padidintas tikslumas
Sumažintas dispersija tokiems dalykams kaip laiko įvestis

Deja, teigti, kad automatizuotas duomenų rinkimas išsprendžia kiekvieną problemą, yra tiesiog neteisinga. Automatinis duomenų rinkimas vis dar priklauso nuo žmonių sukurtų jutiklių, programų ir kompiuterių aparatinės įrangos, kuri suteikia prieigą tik prie tų duomenų, kuriuos žmonės nusprendžia leisti. Dėl apribojimų, kuriuos žmonės nustato automatizuoto duomenų rinkimo savybėms, rezultatas dažnai suteikia mažiau naudingos informacijos, nei tikėjosi dizaineriai. Todėl automatizuotas duomenų rinkimas nuolat keičiasi, nes dizaineriai bando išspręsti įvesties problemas.

Automatizuotas duomenų rinkimas taip pat kenčia nuo programinės ir aparatinės įrangos klaidų, esančių bet kurioje kompiuterinėje sistemoje, tačiau gali kilti daugiau minkštųjų problemų (kurios iškyla, kai sistema atrodo veikianti, bet neduoda norimo rezultato) nei kitose kompiuterinėse sistemose. sąrankos. Kai sistema veikia, įvesties patikimumas gerokai viršija žmogaus galimybes. Tačiau, kai kyla problemų, sistema dažnai nesugeba atpažinti, kad problema egzistuoja, kaip gali žmogus, todėl duomenų rinkinyje gali būti daugiau vidutiniškų ar net blogų duomenų.

Kaip naudoti antraštes ir poraštes „Microsoft Word“.

„Microsoft Word“ galite sukurti antraštes ir poraštes, kurios kiekvieno puslapio viršuje arba apačioje kartotų tą patį tekstą.

Kaip prisijungti prie „Discord“ serverio

Sužinokite, kaip prisijungti prie „Discord“ serverio, kad galėtumėte prisijungti prie bendruomenių ir dalintis savo interesais.

Kaip nustatyti „Discord“ serverio paskyrą

Pirmasis jūsų darbas naudojant šią naują platformą – pirmiausia prisistatyti „Discord“. Sužinokite, kaip nustatyti „Discord“ serverio paskyrą.

Kaip dalytis turiniu su „Zoom“ susitikimo dalyviais

Sužinokite, kaip bendrinti ekraną „Zoom“ platformoje su kitais, kaip leisti jiems valdyti jūsų ekraną ir kaip paprašyti valdyti pagrindinio kompiuterio ekraną.

Kaip rašyti Excel formules

Formulė yra matematinis skaičiavimas. Sužinokite, kaip rašyti Excel formules ir efektyviai jas naudoti.

Kaip pakviesti žmones į savo „Discord“ serverį

Sužinokite, kaip išsiųsti kvietimus ir sukurti savo internetinę bendruomenę „Discord“ serveryje. Taip pat sužinokite, kaip srautinis perdavimas padeda skleisti informaciją jūsų „Discord“.

Kaip pakeisti pastraipų eilučių tarpus „Microsoft Word“.

Sužinokite, kaip galima lengvai ir efektyviai reguliuoti tarpus tarp eilučių „Microsoft Word“ naudojant įvairias nustatymų parinktis.

Kaip sukurti kompiuterio failo ar aplanko nuorodą

Sužinokite, kaip lengvai sukurti kompiuterio failo ar aplanko nuorodą darbalaukyje. Šis procesas suteikia greitą prieigą prie dažniausiai naudojamų programų ir dokumentų.

Senjorams: kaip įterpti iliustraciją į „PowerPoint“ skaidrę

Iliustracija yra iš anksto nupieštas bendras meno kūrinys, o „Microsoft“ su „Office“ produktais nemokamai teikia daug iliustracijų failų. Galite įterpti iliustraciją į savo „PowerPoint“ skaidrės maketą. Lengviausias būdas įterpti iliustraciją yra naudoti vieną iš vietos rezervavimo ženklų skaidrės makete: Rodyti skaidrę, kurioje yra iliustracija […]

Senjorams: kaip užpildyti spalvą „Microsoft Excel“.

Užpildymo spalva (dar vadinama šešėliavimu) yra spalva arba raštas, užpildantis vienos ar kelių „Excel“ darbalapio langelių foną. Tamsinimas gali padėti skaitytojo akims sekti informaciją visame puslapyje ir suteikti darbalapiui spalvų bei vizualinio susidomėjimo. Kai kurių tipų skaičiuoklėse, pavyzdžiui, čekių knygelės registre, […]