5 chyb v datech pro umělou inteligenci

Lidé jsou zvyklí vidět data v mnoha případech za to, čím jsou: za názor. Ve skutečnosti v některých případech lidé zkreslují data do bodu, kdy se stanou zbytečnými, nepravdou. Počítač nebo aplikace umělé inteligence nerozlišují mezi pravdivými a nepravdivými údaji – vidí pouze data. Jedním z problémů, který ztěžuje, ne-li znemožňuje, vytvořit AI, která skutečně myslí jako člověk, je, že lidé mohou pracovat s nepravdami a počítače nikoli. Nejlepší, čeho můžete doufat, je vidět chybná data jako odlehlé hodnoty a pak je odfiltrovat, ale tato technika nemusí nutně problém vyřešit, protože člověk by stále používal data a pokoušel se určit pravdu založenou na nepravdách, které jsou tam.

Obvyklá myšlenka na vytváření méně kontaminovaných datových sad je, že namísto toho, aby lidé mohli vstupovat do dat, mělo by být možné shromažďovat data pomocí senzorů nebo jiných prostředků. Bohužel senzory a další metodologie mechanického vstupu odrážejí cíle jejich lidských vynálezců a limity toho, co je konkrétní technologie schopna detekovat. V důsledku toho jsou i data odvozená ze stroje nebo ze senzoru také předmětem generování nepravd, které je pro AI poměrně obtížné odhalit a překonat.

Následující diskuse používá jako hlavní příklad dopravní nehodu k ilustraci pěti typů nepravd, které se mohou objevit v datech. Koncepty, které se nehoda snaží zobrazit, se nemusí vždy objevit v datech a mohou se objevit jiným způsobem, než se diskutovalo. Faktem zůstává, že s těmito věcmi se běžně musíte při prohlížení dat vypořádat.

Mistruths of Commission

Mistruths of Commission jsou takové, které odrážejí přímý pokus nahradit pravdivé informace nepravdivými informacemi. Například při vyplňování zprávy o nehodě mohl někdo uvést, že ho na chvíli oslepilo slunce, takže nebylo možné vidět někoho, koho trefil. Ve skutečnosti byla osoba možná rozptylována něčím jiným nebo ve skutečnosti nepřemýšlela o řízení (možná zvažovala příjemnou večeři). Pokud nikdo nemůže vyvrátit tuto teorii, může si ten člověk vystačit s menším poplatkem. Jde však o to, že by byla kontaminována i data. Výsledkem je, že nyní by pojišťovna zakládala pojistné na chybných datech.

Ačkoli by se zdálo, že nepravdám o provizi se lze zcela vyhnout, často tomu tak není. Lidé říkají „malé bílé lži“, aby ušetřili ostatní rozpaky nebo aby se s problémem vypořádali s nejmenším osobním úsilím. Někdy je nepravda o provizi založena na chybném vstupu nebo doslechu. Ve skutečnosti je zdrojů provizních chyb tolik, že je opravdu těžké přijít se scénářem, kde by se jim někdo mohl úplně vyhnout. To vše řečeno, nepravdy o provizi jsou jedním z typů nepravd, kterým se někdo může vyhnout častěji než ne.

Mistruths of Omission

Nepravdivé opomenutí jsou takové, kdy osoba říká pravdu v každé uvedené skutečnosti, ale vynechává důležitou skutečnost, která by změnila vnímání incidentu jako celku. Když se znovu zamyslíte nad zprávou o nehodě, řekněte, že někdo srazí jelena a způsobí značnou škodu na jeho autě. Po pravdě říká, že cesta byla mokrá; bylo blízko soumraku, takže světlo nebylo tak dobré, jak by mohlo být; trochu se opozdil v sešlápnutí brzdy; a jelen prostě vyběhl z houštiny na kraji silnice. Závěr by byl, že incident je prostě nehoda.

Osoba však vynechala důležitou skutečnost. V té době psal SMS. Pokud by strážci zákona o SMS věděli, změnili by důvod nehody na nepozorné řízení. Řidič by mohl dostat pokutu a likvidátor pojištění by při zadávání události do databáze použil jiný důvod. Stejně jako v případě nepravdy provize by výsledná chybná data změnila způsob, jakým pojišťovna upravuje pojistné.

Vyhnout se nepravdám o opomenutí je téměř nemožné. Ano, někdo by mohl ve zprávě záměrně vynechat fakta, ale stejně tak je pravděpodobné, že někdo zapomene uvést všechna fakta. Většina lidí je totiž po nehodě docela otřesená, takže je snadné ztratit pozornost a hlásit jen ty pravdy, které zanechaly nejvýraznější dojem. I když si člověk později vzpomene na další podrobnosti a nahlásí je, databáze pravděpodobně nikdy nebude obsahovat úplný soubor pravd.

Mistruths of Perspective

K chybným perspektivám dochází, když více stran nahlíží na incident z více úhlů pohledu. Například při zvažování nehody se sraženým chodcem by osoba, která řídí auto, osoba, kterou auto srazilo, a přihlížející, který byl svědkem události, měli různé perspektivy. Důstojník přijímající zprávy od každé osoby by pochopitelně od každé získal jiná fakta, a to i za předpokladu, že každá osoba říká pravdu, jak ji každý zná. Praxe ve skutečnosti ukazuje, že tomu tak je téměř vždy a to, co policista předkládá jako zprávu, je středem toho, co každý ze zúčastněných uvádí, doplněný o osobní zkušenost. Jinými slovy, zpráva se bude blížit pravdě, ale ne dostatečně blízko pro AI.

Když se zabýváme perspektivou, je důležité vzít v úvahu nadhled. Řidič vozu vidí na palubní desku a zná stav vozu v době nehody. To jsou informace, které zbylým dvěma stranám chybí. Stejně tak osoba, kterou auto srazí, má nejlepší výhled, aby viděla výraz obličeje řidiče (záměr). Přihlížející může být v nejlepší pozici, aby viděl, zda se řidič pokusil zastavit, a vyhodnotil problémy, jako je to, zda se řidič nepokoušel uhnout. Každá strana bude muset vytvořit zprávu na základě viděných dat bez výhod skrytých dat.

Perspektiva je možná nejnebezpečnější z nepravd, protože každý, kdo se v tomto scénáři pokusí odvodit pravdu, skončí v nejlepším případě s průměrem různých příběhů, které nikdy nebudou zcela správné. Člověk, který si informace prohlíží, se může spolehnout na intuici a instinkt, aby potenciálně získal lepší aproximaci pravdy, ale AI bude vždy používat pouze průměr, což znamená, že AI je vždy ve značné nevýhodě. Bohužel, vyhnout se nepravdivým perspektivám je nemožné, protože bez ohledu na to, kolik svědků události máte, to nejlepší, čeho můžete dosáhnout, je přiblížení se pravdě, nikoli skutečné pravdě.

Je zde také další druh nepravdy, kterou je třeba zvážit, a je to nepravda perspektivy. Přemýšlejte o tomto scénáři: Jste neslyšící v roce 1927. Každý týden jdete do divadla na němý film a hodinu nebo déle se cítíte jako všichni ostatní. Film můžete prožít stejně jako ostatní; nejsou žádné rozdíly. V říjnu toho roku vidíte ceduli s nápisem, že divadlo upgraduje, aby podporovalo zvukový systém, aby mohlo zobrazovat hovory— filmy se zvukovou stopou. Cedule říká, že je to ta nejlepší věc vůbec, a zdá se, že téměř všichni souhlasí, kromě vás, neslyšícího člověka, který se nyní cítí jako občan druhé kategorie, jiný než všichni ostatní a dokonce téměř vyloučený z divadla. . V očích neslyšícího je to znamení nepravda; přidání zvukového systému je nejhorší možná věc, ne nejlepší možná věc. Jde o to, že to, co se zdá být obecně pravdivé, ve skutečnosti neplatí pro všechny. Myšlenka obecné pravdy – pravdy, která platí pro každého – je mýtus. to neexistuje.

Mistruths of Bias

K chybám zaujatosti dochází, když je někdo schopen vidět pravdu, ale kvůli osobním obavám nebo přesvědčení ji není schopen skutečně vidět. Například při přemýšlení o nehodě může řidič zaměřit pozornost tak úplně na střed vozovky, že jelen na okraji vozovky se stane neviditelným. Řidič tak nemá čas zareagovat, když se jelen náhle rozhodne vyběhnout doprostřed silnice ve snaze přejít.

Problém se zaujatostí je, že může být neuvěřitelně těžké kategorizovat. Například řidič, který neuvidí jelena, může mít skutečnou nehodu, což znamená, že jelen byl skryt křovím. Řidič se však také může provinit nepozorným řízením kvůli nesprávnému zaostření. Řidič může také zažít chvilkové rozptýlení. O tom, že řidič jelena neviděl, zkrátka nejde; místo toho jde o to, proč řidič jelena neviděl. V mnoha případech se potvrzení zdroje zkreslení stává důležitým při vytváření algoritmu navrženého k zamezení zdroje zkreslení.

Teoreticky je vždy možné vyhnout se nepravdám o zaujatosti. Ve skutečnosti však mají všichni lidé předsudky různých typů a tyto předsudky vždy povedou k nepravdám, které zkreslují datové sady. Jen přimět někoho, aby se skutečně podíval a pak něco viděl – aby se to zaregistrovalo v mozku člověka – je obtížný úkol. Lidé spoléhají na filtry, aby se vyhnuli přetížení informacemi, a tyto filtry jsou také zdrojem zkreslení, protože lidem brání ve skutečném vidění věcí.

Referenční rámec

Z pěti nepravd nemusí být referenční rámec ve skutečnosti výsledkem jakéhokoli omylu, ale výsledkem porozumění. Nepravda v rámci referenčního rámce nastává, když jedna strana něco popisuje, například událost, jako je nehoda, a protože druhá strana nemá s touto událostí zkušenosti, detaily se zamotají nebo jsou zcela nepochopeny. Existuje mnoho komediálních rutin, které se spoléhají na chyby v referenčním rámci. Jeden slavný příklad je od Abbotta a Costella, Kdo je první? . Přimět jednu osobu, aby pochopila, co druhá osoba říká, může být nemožné, když první osobě chybí zkušenostní znalost – referenční rámec.

Další příklad nepravdy v rámci referenčního rámce nastává, když jedna strana nemůže rozumět druhé. Například námořník zažije bouři na moři. Možná je to monzun, ale předpokládejme na okamžik, že bouře je silná – možná životu nebezpečná. I s využitím videí, rozhovorů a simulátoru by zážitek z pobytu na moři v život ohrožující bouři bylo nemožné zprostředkovat někomu, kdo takovou bouři na vlastní kůži nezažil; ta osoba nemá žádný referenční rámec.

Nejlepší způsob, jak se vyhnout nepravdám v referenčním rámci, je zajistit, aby všechny zúčastněné strany mohly vytvořit podobné referenční rámce. Ke splnění tohoto úkolu vyžadují různé strany podobné zkušenostní znalosti, aby byl zajištěn přesný přenos dat z jedné osoby na druhou. Při práci s datovým souborem, který je nutně zaznamenán, statickými daty, se však chyby v rámci referenčního rámce budou stále vyskytovat, když potenciálnímu divákovi chybí požadované zkušenostní znalosti.

AI bude mít vždy problémy s referenčním rámcem, protože AI nutně postrádá schopnost vytvořit zážitek. Databanka získaných znalostí není to samé. Databanka by obsahovala fakta, ale zkušenosti jsou založeny nejen na faktech, ale i na závěrech, které současná technologie nedokáže zkopírovat.


Recenzia Snagit 2018 Čo je nové od verzie 13

Recenzia Snagit 2018 Čo je nové od verzie 13

TechSmith Snagit je náš obľúbený softvér na úpravu snímok obrazovky a obrázkov. Pozrite si nové funkcie v Snagit 2018!

8 online nástrojov na kreslenie diagramov a vývojových diagramov

8 online nástrojov na kreslenie diagramov a vývojových diagramov

Potrebujete vytvoriť diagramy alebo vývojové diagramy a nechcete inštalovať ďalší softvér? Tu je zoznam online nástrojov na vytváranie diagramov.

Spotify nemôže prehrať aktuálnu skladbu? Ako opraviť

Spotify nemôže prehrať aktuálnu skladbu? Ako opraviť

Mať dom plný bezdrôtovo pripojených zariadení a streamovacích služieb, ako je Spotify, je skvelé, kým veci nefungujú a nenájdete zaujímavé riešenia.

Čo je NVMe M.2 SSD a aký je rýchly?

Čo je NVMe M.2 SSD a aký je rýchly?

NVMe M.2 SSD je najnovšia technológia počítačových pevných diskov. Čo to je a aká je rýchlosť v porovnaní so staršími pevnými diskami a SSD (Solid State Drive)?

Sonos vs. AirPlay: Prečo som si vybral AirPlay pre zvuk celého domu

Sonos vs. AirPlay: Prečo som si vybral AirPlay pre zvuk celého domu

Sonos je správne fungujúce audio riešenie na streamovanie od 400 USD za dva reproduktory. Ale pri správnom nastavení môže byť AirPlay zadarmo. Pozrime sa na podrobnosti.

Aplikácia Zálohovanie a synchronizácia Google nahrádza Fotky a Disk

Aplikácia Zálohovanie a synchronizácia Google nahrádza Fotky a Disk

Zálohovanie a synchronizácia Google je nová aplikácia, ktorá sa synchronizuje s aplikáciami Fotky a Disk. Čítajte ďalej a zistite, ako si stojí v porovnaní s OneDrive, Dropbox, Backblaze a Crashplan.

Rezanie káblov: Recenzia MyIPTV so SOPlayerom

Rezanie káblov: Recenzia MyIPTV so SOPlayerom

MyIPTV je služba na strihanie káblov, ktorá využíva aplikáciu SOPlayer pre viacero platforiem a poskytuje televíziu, filmy a iné formy médií za platené

Logitech Illuminated Living-Room Keyboard K830

Logitech Illuminated Living-Room Keyboard K830

Spoločnosť Logitech nedávno vydala svoju klávesnicu Illuminated Living-Room Keyboard K830, ktorá je určená ako spoločník domácej zábavy. Tu je naša recenzia jednotky.

Aktualizácia CloudHQ: Rýchlejšia synchronizácia, úprava súborov Dropbox z Dokumentov Google

Aktualizácia CloudHQ: Rýchlejšia synchronizácia, úprava súborov Dropbox z Dokumentov Google

Tu je pohľad na aktualizáciu, ktorá bola nedávno vydaná pre CloudHQ a ako funguje. Čítajte ďalej a dozviete sa viac.

Čo je telefón OnePlus 6T Android?

Čo je telefón OnePlus 6T Android?

OnePlus 6T je prvotriedny kvalitný telefón s Androidom, ktorý sa predáva so zľavou v porovnaní s Apple iPhone, Google Pixel 3 alebo Samsung Galaxy S9.