Si mund të përdorë me sukses inteligjenca artificiale të dhënat

Të kesh të dhëna të shumta në dispozicion nuk mjafton për të krijuar një AI të suksesshme. Aktualisht, një algoritëm i AI nuk mund të nxjerrë informacion direkt nga të dhënat e papërpunuara. Shumica e algoritmeve mbështeten në mbledhjen dhe manipulimin e jashtëm përpara analizës. Kur një algoritëm mbledh informacion të dobishëm, ai mund të mos përfaqësojë informacionin e duhur. Diskutimi i mëposhtëm ju ndihmon të kuptoni se si të grumbulloni, manipuloni dhe automatizoni mbledhjen e të dhënave nga një këndvështrim i përgjithshëm.

Duke pasur parasysh burimet e të dhënave

Të dhënat që përdorni vijnë nga një sërë burimesh. Burimi më i zakonshëm i të dhënave është nga informacioni i futur nga njerëzit në një moment. Edhe kur një sistem mbledh automatikisht të dhënat e faqes së blerjeve, njerëzit fillimisht futin informacionin. Një njeri klikon artikuj të ndryshëm, i shton ato në një karrocë blerjesh, specifikon karakteristikat (siç janë madhësia) dhe sasia, dhe më pas i kontrollon. Më vonë, pas shitjes, njeriu i jep përvojës së blerjes, produktit dhe mënyrës së dorëzimit një vlerësim dhe bën komente. Me pak fjalë, çdo përvojë e blerjeve bëhet gjithashtu një ushtrim për mbledhjen e të dhënave.

Shumë burime të të dhënave sot mbështeten në të dhënat e mbledhura nga burimet njerëzore. Njerëzit gjithashtu ofrojnë të dhëna manuale. Ju telefononi ose shkoni në një zyrë diku për të lënë një takim me një profesionist. Një recepsionist më pas mbledh informacionin nga ju që nevojiten për takimin. Këto të dhëna të mbledhura manualisht përfundimisht përfundojnë në një grup të dhënash diku për qëllime analize.

Të dhënat mblidhen gjithashtu nga sensorët, dhe këta sensorë mund të marrin pothuajse çdo formë. Për shembull, shumë organizata e bazojnë mbledhjen e të dhënave fizike, si numri i njerëzve që shohin një objekt në një dritare, në zbulimin e celularëve. Softueri i njohjes së fytyrës mund të zbulojë potencialisht klientët e përsëritur.

Megjithatë, sensorët mund të krijojnë grupe të dhënash nga pothuajse çdo gjë. Shërbimi i motit mbështetet në grupet e të dhënave të krijuara nga sensorë që monitorojnë kushtet mjedisore si shiu, temperatura, lagështia, mbulimi i reve etj. Sistemet e monitorimit robotik ndihmojnë në korrigjimin e të metave të vogla në funksionimin robotik duke analizuar vazhdimisht të dhënat e mbledhura nga sensorët e monitorimit. Një sensor, i kombinuar me një aplikacion të vogël të AI, mund t'ju tregojë se kur darka juaj është gatuar në perfeksion sonte. Sensori mbledh të dhëna, por aplikacioni i AI përdor rregulla për të ndihmuar në përcaktimin se kur ushqimi është gatuar siç duhet.

Marrja e të dhënave të besueshme

Fjala e besueshme duket kaq e lehtë për t'u përcaktuar, por kaq e vështirë për t'u zbatuar. Diçka është e besueshme kur rezultatet që prodhon janë të pritshme dhe të qëndrueshme. Një burim i besueshëm i të dhënave prodhon të dhëna të zakonshme që nuk përmbajnë surpriza; askush nuk është aspak i tronditur nga rezultati. Në varësi të këndvështrimit tuaj, në të vërtetë mund të jetë një gjë e mirë që shumica e njerëzve nuk po gezojnë dhe më pas nuk po bien në gjumë kur shqyrtojnë të dhënat. Surprizat i bëjnë të dhënat me vlerë për t'u analizuar dhe rishikuar. Rrjedhimisht, të dhënat kanë një aspekt të dualitetit. Ne duam të dhëna të besueshme, të zakonshme, plotësisht të parashikuara që thjesht konfirmojnë atë që ne tashmë e dimë, por e papritura është ajo që e bën mbledhjen e të dhënave të dobishme në radhë të parë.

Prapëseprapë, ju nuk dëshironi të dhëna që janë aq të jashtzakonshme sa të bëhen pothuajse të frikshme për t'u rishikuar. Gjatë marrjes së të dhënave duhet të ruhet ekuilibri. Të dhënat duhet të përshtaten brenda kufijve të caktuar. Ai gjithashtu duhet të plotësojë kritere specifike për vlerën e së vërtetës. Të dhënat duhet gjithashtu të vijnë në intervalet e pritshme dhe të gjitha fushat e regjistrimit të të dhënave hyrëse duhet të jenë të plota.

Në një farë mase, siguria e të dhënave ndikon gjithashtu në besueshmërinë e të dhënave. Konsistenca e të dhënave vjen në disa forma. Kur të mbërrijnë të dhënat, mund të siguroheni që ato të bien brenda kufijve të pritur dhe të shfaqen në një formë të veçantë. Megjithatë, pasi të ruani të dhënat, besueshmëria mund të ulet nëse nuk siguroheni që të dhënat të mbeten në formën e pritur. Një njësi ekonomike që përleshet me të dhënat ndikon në besueshmërinë, duke i bërë të dhënat të dyshimta dhe potencialisht të papërdorshme për analiza më vonë. Sigurimi i besueshmërisë së të dhënave do të thotë që pasi të mbërrijnë të dhënat, askush nuk i ngatërron ato për t'i bërë ato të përshtaten brenda një domeni të pritshëm (duke e bërë të zakonshme si rezultat).

Bërja e kontributit njerëzor më të besueshëm

Njerëzit bëjnë gabime - kjo është pjesë e të qenit njerëzor. Në fakt, të presësh që njerëzit të mos bëjnë gabime është e paarsyeshme. Megjithatë, shumë modele aplikacionesh supozojnë se njerëzit në njëfarë mënyre nuk do të bëjnë gabime të asnjë lloji. Dizajni pret që të gjithë thjesht të ndjekin rregullat. Fatkeqësisht, shumica dërrmuese e përdoruesve janë të garantuar që as të mos i lexojnë rregullat, sepse shumica e njerëzve janë gjithashtu dembelë ose shumë të prirur për kohën kur bëhet fjalë për të bërë gjëra që nuk i ndihmojnë ata drejtpërdrejt.

Merrni parasysh hyrjen e një shteti në një formë. Nëse jepni vetëm një fushë teksti, disa përdorues mund të fusin të gjithë emrin e shtetit, si p.sh. Kansas. Natyrisht, disa përdorues do të bëjnë një gabim shtypi ose shkronja të mëdha dhe do të dalin me Kansus ose kANSAS. Duke vendosur këto gabime, njerëzit dhe organizatat kanë qasje të ndryshme për kryerjen e detyrave. Dikush në industrinë e botimeve mund të përdorë udhëzuesin e stilit të Associated Press (AP) dhe të dhëna Kan. Dikush që është më i vjetër dhe i mësuar me udhëzimet e Zyrës së Shtypit të Qeverisë (GPO) mund të japë Kans. në vend të kësaj. Përdoren edhe shkurtesa të tjera. Zyra Postare e SHBA (USPS) përdor KS, por Roja Bregdetare e SHBA përdor KA. Ndërkohë, forma e Organizatës Ndërkombëtare të Standardeve (ISO) shkon me US-KS. Ki parasysh, ky është vetëm një hyrje në gjendje, e cila është mjaft e drejtpërdrejtë - ose kështu keni menduar para se të lexoni këtë seksion. E qartë,

Kutitë e listës rënëse funksionojnë mirë për një grup të mrekullueshëm hyrjesh të dhënash, dhe përdorimi i tyre siguron që hyrja njerëzore në ato fusha të bëhet jashtëzakonisht e besueshme sepse njeriu nuk ka zgjidhje tjetër veçse të përdorë një nga hyrjet e paracaktuara. Natyrisht, njeriu gjithmonë mund të zgjedhë hyrjen e gabuar, ku hyjnë në lojë kontrollet e dyfishta. Disa aplikacione më të reja krahasojnë kodin ZIP me hyrjet e qytetit dhe të shtetit për të parë nëse ato përputhen. Kur ato nuk përputhen, përdoruesit i kërkohet sërish të japë të dhëna të sakta. Ky kontroll i dyfishtë arrin të jetë i bezdisshëm, por përdoruesi nuk ka gjasa ta shohë atë shumë shpesh, kështu që nuk duhet të bëhet shumë i bezdisshëm.

Edhe me kontrolle të kryqëzuara dhe shënime statike, njerëzit kanë ende shumë hapësirë ​​për të bërë gabime. Për shembull, futja e numrave mund të jetë problematike. Kur një përdorues duhet të fusë 2.00, ju mund të shihni 2, ose 2.0, ose 2., ose ndonjë nga një sërë hyrjesh të tjera. Për fat të mirë, analizimi i hyrjes dhe riformatimi i tij do ta rregullojë problemin dhe ju mund ta kryeni këtë detyrë automatikisht, pa ndihmën e përdoruesit.

Fatkeqësisht, riformatimi nuk do të korrigjojë një hyrje numerike të gabuar. Ju mund t'i zbusni pjesërisht gabime të tilla duke përfshirë kontrollet e diapazonit. Një klient nuk mund të blejë -5 copë sapun. Mënyra legjitime për t'i treguar klientit që kthen grilat e sapunit është të përpunojë një kthim, jo ​​një shitje. Megjithatë, përdoruesi mund të ketë bërë thjesht një gabim dhe ju mund të jepni një mesazh që tregon diapazonin e duhur të hyrjes për vlerën.

Duke përdorur mbledhjen e automatizuar të të dhënave

Disa njerëz mendojnë se mbledhja e automatizuar e të dhënave zgjidh të gjitha çështjet e hyrjes njerëzore që lidhen me grupet e të dhënave. Në fakt, mbledhja e automatizuar e të dhënave ofron një numër përfitimesh:

  • Konsistencë më e mirë
  • Besueshmëri e përmirësuar
  • Probabilitet më i ulët i mungesës së të dhënave
  • Saktësia e zgjeruar
  • Varianca e reduktuar për gjëra të tilla si inputet me kohë

Fatkeqësisht, të thuash se mbledhja e automatizuar e të dhënave zgjidh çdo problem është thjesht e gabuar. Mbledhja e automatizuar e të dhënave ende mbështetet në sensorë, aplikacione dhe pajisje kompjuterike të krijuara nga njerëzit që ofrojnë akses vetëm në të dhënat që njerëzit vendosin të lejojnë. Për shkak të kufijve që njerëzit vendosin në karakteristikat e mbledhjes së automatizuar të të dhënave, rezultati shpesh ofron informacion më pak të dobishëm sesa shpresohej nga projektuesit. Rrjedhimisht, mbledhja e automatizuar e të dhënave është në një gjendje të vazhdueshme fluksi pasi projektuesit përpiqen të zgjidhin çështjet e hyrjes.

Mbledhja e automatizuar e të dhënave gjithashtu vuan nga gabimet e softuerit dhe harduerit të pranishëm në çdo sistem kompjuterik, por me një potencial më të lartë për çështje të buta (të cilat lindin kur sistemi në dukje funksionon, por nuk po jep rezultatin e dëshiruar) sesa llojet e tjera të kompjuterëve. konfigurimet. Kur sistemi funksionon, besueshmëria e hyrjes i kalon shumë aftësitë njerëzore. Megjithatë, kur ndodhin probleme të buta, sistemi shpesh nuk arrin të kuptojë se ekziston një problem, siç mundet njeriu, dhe për këtë arsye grupi i të dhënave mund të përfundojë të përmbajë të dhëna më mediokre apo edhe të këqija.


Për të moshuarit: Si të futni Clip Art në një rrëshqitje në PowerPoint

Për të moshuarit: Si të futni Clip Art në një rrëshqitje në PowerPoint

Klip arti është vepra arti e përgjithshme e para-vizatuar dhe Microsoft ofron shumë skedarë klipi art falas me produktet e tij të Office. Mund të futni klip art në paraqitjen tuaj të rrëshqitjes në PowerPoint. Mënyra më e lehtë për të futur artin e klipit është duke përdorur një nga mbajtësit e vendeve në një plan urbanistik: Shfaq një rrëshqitje që përmban një Clip Art […]

Për të moshuarit: Si të mbushni ngjyrën në Microsoft Excel

Për të moshuarit: Si të mbushni ngjyrën në Microsoft Excel

Ngjyra e mbushjes - e quajtur gjithashtu hijezim - është ngjyra ose modeli që mbush sfondin e një ose më shumë qelizave të fletës së punës Excel. Zbatimi i hijeve mund të ndihmojë sytë e lexuesit të ndjekin informacionin nëpër një faqe dhe mund të shtojë ngjyra dhe interes vizual në një fletë pune. Në disa lloje fletëllogaritëse, të tilla si regjistri i fletores së çeqeve, […]

Shtimi i kontakteve të reja në akt! 2005

Shtimi i kontakteve të reja në akt! 2005

Në nivelin më të thjeshtë, qëllimi kryesor i ACT! është të shërbejë si një vend për të ruajtur të gjitha kontaktet me të cilat ndërveproni në baza ditore. Mund të shtoni dhe modifikoni të gjitha kontaktet tuaja nga dritarja Detajet e Kontaktit sepse përmban të gjithë informacionin që i përket një regjistrimi të veçantë dhe […]

Fleta e mashtrimit të mosmarrëveshjeve për LuckyTemplates

Fleta e mashtrimit të mosmarrëveshjeve për LuckyTemplates

Përdorni këtë fletë mashtrimi për të hyrë menjëherë në përdorimin e Discord. Zbuloni robotë të dobishëm Discord, aplikacione që mund të integroni dhe këshilla për intervistimin e të ftuarve.

OpenOffice.org Për Fletën e mashtrimit të LuckyTemplates

OpenOffice.org Për Fletën e mashtrimit të LuckyTemplates

Paketa e zyrës OpenOffice.org ka shumë mjete për ta bërë më të lehtë jetën e punës. Kur jeni duke punuar në OpenOffice.org, njihuni me shiritin e veglave të funksionit (i cili duket pothuajse i njëjtë në të gjitha aplikacionet) dhe butonat kryesorë të shiritit të veglave për ndihmë me komandat bazë për shumicën e detyrave.

Makina bombë e Alan Turingut

Makina bombë e Alan Turingut

Makina Bombe e Alan Turing nuk ishte asnjë formë e inteligjencës artificiale (AI). Në fakt, nuk është as një kompjuter i vërtetë. Ai theu mesazhet kriptografike Enigma, dhe kaq. Megjithatë, ai siguroi ushqim për mendim për Turingun, i cili përfundimisht çoi në një punim të titulluar "Makineri dhe Inteligjenca Kompjuterike"?? që ai botoi në vitet 1950 që përshkruan […]

Mangësitë standarde të harduerit për inteligjencën artificiale

Mangësitë standarde të harduerit për inteligjencën artificiale

Aftësia për të krijuar një sistem modular ka përfitime të rëndësishme, veçanërisht në biznes. Aftësia për të hequr dhe zëvendësuar komponentë individualë i mban kostot të ulëta ndërsa lejon përmirësime në rritje si në shpejtësi ashtu edhe në efikasitet. Megjithatë, si me shumë gjëra, nuk ka drekë falas. Modulariteti i ofruar nga arkitektura Von Neumann vjen me disa […]

10 të bëra dhe mospërfillje kur përdorni QuarkXPress

10 të bëra dhe mospërfillje kur përdorni QuarkXPress

Nëse do t'ju duhej të zgjidhnit dhjetë gjëra të lehta për t'u harruar, por jashtëzakonisht të dobishme për t'u mbajtur mend rreth QuarkXPress, ato në listën e mëposhtme, i dashur lexues, do të ishin ato. Namaste. Flisni me printerin tuaj komercial Të gjitha projektet e printimit fillojnë dhe përfundojnë me printerin. Kjo sepse vetëm printerët i dinë kufizimet e tyre dhe mijëra mënyra se si mund të bëhet një projekt […]

Origjina e Bitcoin

Origjina e Bitcoin

Aspekti më i rëndësishëm i bitcoin mund të jetë koncepti që qëndron pas tij. Bitcoin u krijua nga zhvilluesi Satoshi Nakamoto. Në vend që të përpiqej të krijonte një metodë krejtësisht të re pagese për të përmbysur mënyrën se si ne të gjithë paguajmë për gjërat në internet, Satoshi pa disa probleme me sistemet ekzistuese të pagesave dhe donte t'i adresonte ato. Koncepti i […]

Si të mbroni privatësinë tuaj kur përdorni Bitcoin

Si të mbroni privatësinë tuaj kur përdorni Bitcoin

Një nivel i caktuar anonimiteti është i lidhur me përdorimin e bitcoin dhe monedhës dixhitale në përgjithësi. Nëse mund ta etiketoni atë si "mjaft anonim" është një mendim personal. Ka mënyra për të mbrojtur privatësinë tuaj kur përdorni bitcoin për të lëvizur fondet, por këto kërkojnë disa përpjekje dhe planifikim: Ju mund të krijoni një adresë të re për […]