Jak umělá inteligence může úspěšně využívat data

Mít k dispozici dostatek dat nestačí k vytvoření úspěšné umělé inteligence. Algoritmus AI v současné době nemůže extrahovat informace přímo z nezpracovaných dat. Většina algoritmů se před analýzou spoléhá na externí sběr a manipulaci. Když algoritmus shromažďuje užitečné informace, nemusí představovat správné informace. Následující diskuse vám pomůže pochopit, jak shromažďovat, manipulovat a automatizovat shromažďování dat z pohledu přehledu.

S ohledem na zdroje dat

Údaje, které používáte, pocházejí z mnoha zdrojů. Nejběžnějším zdrojem dat jsou informace zadané lidmi v určitém okamžiku. I když systém shromažďuje data nákupního webu automaticky, lidé je nejprve zadávají. Člověk klikne na různé položky, přidá je do nákupního košíku, zadá vlastnosti (jako je velikost) a množství a poté je zkontroluje. Později, po prodeji, člověk ohodnotí zážitek z nakupování, produkt a způsob doručení a přidá komentáře. Stručně řečeno, každý nákupní zážitek se stává také cvičením pro sběr dat.

Mnoho zdrojů dat se dnes spoléhá na vstupy získané z lidských zdrojů. Lidé také poskytují manuální vstup. Zavoláte nebo zajdete někam do kanceláře a domluvíte si schůzku s profesionálem. Recepční pak od vás shromáždí informace potřebné pro schůzku. Tato ručně shromážděná data nakonec skončí někde v datové sadě pro účely analýzy.

Data se shromažďují také ze senzorů a tyto senzory mohou mít téměř jakoukoli podobu. Mnoho organizací například zakládá shromažďování fyzických dat, jako je počet lidí, kteří si prohlížejí objekt v okně, na detekci mobilních telefonů. Software pro rozpoznávání obličeje by mohl potenciálně detekovat opakované zákazníky.

Senzory však mohou vytvářet datové sady téměř z čehokoli. Meteorologická služba se spoléhá na datové sady vytvořené senzory, které monitorují podmínky prostředí, jako je déšť, teplota, vlhkost, oblačnost a tak dále. Robotické monitorovací systémy pomáhají napravovat drobné nedostatky v robotickém provozu neustálou analýzou dat shromážděných monitorovacími senzory. Senzor v kombinaci s malou aplikací umělé inteligence by vám mohl říct, kdy je vaše večeře dnes večer dokonale uvařená. Senzor shromažďuje data, ale aplikace AI používá pravidla, která pomáhají definovat, kdy je jídlo správně uvařeno.

Získání spolehlivých dat

Slovo spolehlivý se zdá být tak snadné definovat, a přitom tak obtížně realizovatelné. Něco je spolehlivé, když výsledky, které to produkuje, jsou očekávané a konzistentní. Spolehlivý zdroj dat vytváří světská data, která neobsahují žádná překvapení; nikdo není výsledkem ani v nejmenším šokován. V závislosti na vašem úhlu pohledu může být ve skutečnosti dobře, že většina lidí při prohlížení dat nezívá a pak neusíná. Díky překvapením stojí za to data analyzovat a přezkoumat. V důsledku toho mají data aspekt duality. Chceme spolehlivá, všední, plně očekávaná data, která jednoduše potvrzují to, co již víme, ale díky neočekávaným údajům je shromažďování dat užitečné především.

Přesto nechcete data, která jsou tak mimořádná, že je téměř děsivé kontrolovat. Při získávání dat je třeba udržovat rovnováhu. Data se musí vejít do určitých mezí. Musí také splňovat specifická kritéria pravdivostní hodnoty. Data musí také přicházet v očekávaných intervalech a všechna pole příchozího datového záznamu musí být úplná.

Bezpečnost dat do jisté míry ovlivňuje i spolehlivost dat. Konzistence dat má několik podob. Když data dorazí, můžete se ujistit, že spadají do očekávaných rozsahů a zobrazí se v určité formě. Po uložení dat se však spolehlivost může snížit, pokud nezajistíte, že data zůstanou v očekávané podobě. Entita, která si s daty pohrává, ovlivňuje spolehlivost, díky čemuž jsou data podezřelá a potenciálně nepoužitelná pro pozdější analýzu. Zajištění spolehlivosti dat znamená, že poté, co data dorazí, s nimi nikdo nemanipuluje, aby se vešly do očekávané domény (což je ve výsledku všední).

Učinit lidský vstup spolehlivější

Lidé dělají chyby – je to součást lidského bytí. Ve skutečnosti je nerozumné očekávat, že lidé nebudou dělat chyby. Přesto mnoho návrhů aplikací předpokládá, že lidé nějakým způsobem nebudou dělat chyby jakéhokoli druhu. Design počítá s tím, že všichni budou prostě dodržovat pravidla. Naneštěstí je zaručeno, že velká většina uživatelů si pravidla ani nepřečte, protože většina lidí je také líná nebo příliš tlačená časem, když přijde na věci, které jim přímo nepomáhají.

Zvažte vstup stavu do formuláře. Pokud zadáte pouze textové pole, někteří uživatelé mohou zadat celý název státu, například Kansas. Samozřejmě, že někteří uživatelé udělají překlep nebo chybu v psaní velkých písmen a přijdou s Kansus nebo kANSAS. Při nastavování těchto chyb mají lidé a organizace různé přístupy k provádění úkolů. Někdo z vydavatelského průmyslu může použít průvodce stylem Associated Press (AP) a zadat Kan. Někdo, kdo je starší a zvyklý na pokyny vládního tiskového úřadu (GPO), může zadat Kans. namísto. Používají se i jiné zkratky. Americká pošta (USPS) používá KS, ale americká pobřežní stráž používá KA. Mezitím formulář Mezinárodní organizace pro standardy (ISO) jde s US-KS. Uvědomte si, že toto je pouze stavový záznam, který je poměrně jednoduchý – nebo jste si to alespoň mysleli před přečtením této části. Jasně,

Rozbalovací seznamy fungují dobře pro úžasnou řadu datových vstupů a jejich použití zajišťuje, že lidský vstup do těchto polí se stane extrémně spolehlivým, protože člověk nemá jinou možnost než použít jednu z výchozích položek. Samozřejmě, že člověk může vždy vybrat nesprávný záznam, což je místo, kde přichází do hry dvojitá kontrola. Některé novější aplikace porovnávají PSČ se záznamy města a státu, aby zjistily, zda se shodují. Pokud se neshodují, uživatel je znovu požádán o zadání správného zadání. Tato dvojitá kontrola je obtěžující, ale je nepravděpodobné, že by ji uživatel viděl příliš často, takže by to nemělo být příliš otravné.

I při křížových kontrolách a statických záznamech mají lidé stále dostatek prostoru pro chyby. Problematické může být například zadávání čísel. Když uživatel potřebuje zadat 2,00, může se vám zobrazit 2, 2,0 nebo 2 nebo kteroukoli z mnoha dalších položek. Naštěstí problém vyřeší analýza záznamu a jeho přeformátování a tento úkol můžete provést automaticky bez pomoci uživatele.

Bohužel přeformátování neopraví chybný číselný vstup. Tyto chyby můžete částečně zmírnit zahrnutím kontrol rozsahu. Zákazník si nemůže koupit –5 kusů mýdla. Legální způsob, jak ukázat zákazníkovi, že vrací kostky mýdla, je zpracovat vrácení, nikoli prodej. Uživatel však mohl jednoduše udělat chybu a vy můžete poskytnout zprávu uvádějící správný vstupní rozsah pro hodnotu.

Použití automatizovaného sběru dat

Někteří lidé si myslí, že automatizované shromažďování dat řeší všechny problémy lidského vstupu spojené s datovými sadami. Automatizovaný sběr dat ve skutečnosti poskytuje řadu výhod:

  • Lepší konzistence
  • Vylepšená spolehlivost
  • Nižší pravděpodobnost chybějících údajů
  • Zvýšená přesnost
  • Snížená odchylka pro věci, jako jsou časované vstupy

Bohužel tvrdit, že automatizovaný sběr dat vyřeší každý problém, je prostě nesprávné. Automatizovaný sběr dat stále závisí na senzorech, aplikacích a počítačovém hardwaru navrženém lidmi, které poskytují přístup pouze k datům, která se lidé rozhodnou povolit. Kvůli omezením, která lidé kladou na vlastnosti automatizovaného sběru dat, výsledek často poskytuje méně užitečné informace, než v jaké návrháři doufali. V důsledku toho je automatizovaný sběr dat v neustálém stavu toku, jak se návrháři snaží řešit vstupní problémy.

Automatizovaný sběr dat také trpí jak softwarovými, tak hardwarovými chybami přítomnými v jakémkoli výpočetním systému, ale s vyšším potenciálem měkkých problémů (které nastanou, když systém zjevně funguje, ale neposkytuje požadovaný výsledek) než jiné druhy počítačových systémů. nastavení. Když systém funguje, spolehlivost vstupu daleko přesahuje lidské schopnosti. Když se však vyskytnou měkké problémy, systém často nedokáže rozpoznat, že problém existuje, jako by to mohl člověk udělat, a proto by datová sada mohla skončit obsahovat průměrnější nebo dokonce špatná data.


Recenzia Snagit 2018 Čo je nové od verzie 13

Recenzia Snagit 2018 Čo je nové od verzie 13

TechSmith Snagit je náš obľúbený softvér na úpravu snímok obrazovky a obrázkov. Pozrite si nové funkcie v Snagit 2018!

8 online nástrojov na kreslenie diagramov a vývojových diagramov

8 online nástrojov na kreslenie diagramov a vývojových diagramov

Potrebujete vytvoriť diagramy alebo vývojové diagramy a nechcete inštalovať ďalší softvér? Tu je zoznam online nástrojov na vytváranie diagramov.

Spotify nemôže prehrať aktuálnu skladbu? Ako opraviť

Spotify nemôže prehrať aktuálnu skladbu? Ako opraviť

Mať dom plný bezdrôtovo pripojených zariadení a streamovacích služieb, ako je Spotify, je skvelé, kým veci nefungujú a nenájdete zaujímavé riešenia.

Čo je NVMe M.2 SSD a aký je rýchly?

Čo je NVMe M.2 SSD a aký je rýchly?

NVMe M.2 SSD je najnovšia technológia počítačových pevných diskov. Čo to je a aká je rýchlosť v porovnaní so staršími pevnými diskami a SSD (Solid State Drive)?

Sonos vs. AirPlay: Prečo som si vybral AirPlay pre zvuk celého domu

Sonos vs. AirPlay: Prečo som si vybral AirPlay pre zvuk celého domu

Sonos je správne fungujúce audio riešenie na streamovanie od 400 USD za dva reproduktory. Ale pri správnom nastavení môže byť AirPlay zadarmo. Pozrime sa na podrobnosti.

Aplikácia Zálohovanie a synchronizácia Google nahrádza Fotky a Disk

Aplikácia Zálohovanie a synchronizácia Google nahrádza Fotky a Disk

Zálohovanie a synchronizácia Google je nová aplikácia, ktorá sa synchronizuje s aplikáciami Fotky a Disk. Čítajte ďalej a zistite, ako si stojí v porovnaní s OneDrive, Dropbox, Backblaze a Crashplan.

Rezanie káblov: Recenzia MyIPTV so SOPlayerom

Rezanie káblov: Recenzia MyIPTV so SOPlayerom

MyIPTV je služba na strihanie káblov, ktorá využíva aplikáciu SOPlayer pre viacero platforiem a poskytuje televíziu, filmy a iné formy médií za platené

Logitech Illuminated Living-Room Keyboard K830

Logitech Illuminated Living-Room Keyboard K830

Spoločnosť Logitech nedávno vydala svoju klávesnicu Illuminated Living-Room Keyboard K830, ktorá je určená ako spoločník domácej zábavy. Tu je naša recenzia jednotky.

Aktualizácia CloudHQ: Rýchlejšia synchronizácia, úprava súborov Dropbox z Dokumentov Google

Aktualizácia CloudHQ: Rýchlejšia synchronizácia, úprava súborov Dropbox z Dokumentov Google

Tu je pohľad na aktualizáciu, ktorá bola nedávno vydaná pre CloudHQ a ako funguje. Čítajte ďalej a dozviete sa viac.

Čo je telefón OnePlus 6T Android?

Čo je telefón OnePlus 6T Android?

OnePlus 6T je prvotriedny kvalitný telefón s Androidom, ktorý sa predáva so zľavou v porovnaní s Apple iPhone, Google Pixel 3 alebo Samsung Galaxy S9.