Хората са свикнали да виждат данните каквито са в много случаи: мнение. Всъщност в някои случаи хората изкривяват данните до точката, в която стават безполезни, лъжа. Компютърно или AI приложение не може да направи разликата между верни и неверни данни - всичко, което вижда, са данни. Един от проблемите, които правят трудно, ако не и невъзможно, създаването на AI, който всъщност мисли като човек, е, че хората могат да работят с неистини, а компютрите не могат. Най-доброто, което можете да се надявате да постигнете, е да видите грешните данни като отклонения и след това да ги филтрирате, но тази техника не решава непременно проблема, защото човек все пак ще използва данните и ще се опита да определи истина въз основа на погрешните истини, които има ли.
Често срещана мисъл за създаване на по-малко замърсени набори от данни е, че вместо да се позволи на хората да въвеждат данните, събирането на данните чрез сензори или други средства трябва да бъде възможно. За съжаление, сензорите и други методологии за механично въвеждане отразяват целите на техните изобретатели и границите на това, което конкретната технология е в състояние да открие. Следователно, дори извлечените от машини или сензори данни също са обект на генериране на неистини, които са доста трудни за AI за откриване и преодоляване.
Следващата дискусия използва автомобилна катастрофа като основен пример, за да илюстрира пет вида неистини, които могат да се появят в данните. Концепциите, които произшествието се опитва да изобрази, може да не винаги се появяват в данните и може да се появят по различни начини от обсъжданите. Фактът остава, че обикновено трябва да се справяте с подобни неща, когато преглеждате данни.
Неистини на Комисията
Неистините за извършване на поръчка са тези, които отразяват откровен опит за замяна на истинска информация с невярна информация. Например, когато попълва доклад за злополука, някой може да заяви, че слънцето за момент го е заслепило, което прави невъзможно да се види някой, когото е ударил. В действителност, може би човекът е бил разсеян от нещо друго или всъщност не е мислил за шофиране (вероятно обмисляйки хубава вечеря). Ако никой не може да опровергае тази теория, човекът може да се справи с по-малка такса. Въпросът обаче е, че данните също биха били замърсени. Ефектът е, че сега една застрахователна компания ще базира премиите на грешни данни.
Въпреки че изглежда, че погрешните истини за комисионна са напълно избегнати, често не са. Човек казва „малки бели лъжи“, за да спести смущението на другите или да се справи с проблем с най-малко лично усилие. Понякога лъжата в комисионната се основава на грешни данни или слухове. Всъщност източниците за грешки при комисионните са толкова много, че наистина е трудно да се измисли сценарий, при който някой би могъл да ги избегне напълно. Всичко това казано, погрешните истини за комисионна са един вид неистина, която някой може да избягва по-често, отколкото не.
Погрешни истини за пропускане
Погрешните истини за пропускане са тези, при които човек казва истината във всеки изложен факт, но пропуска важен факт, който би променил възприемането на инцидента като цяло. Помислете отново за доклада за произшествието, кажете, че някой удря елен, причинявайки значителни щети на колата му. Той честно казва, че пътят е бил мокър; беше близо до здрач, така че светлината не беше толкова добра, колкото би могла да бъде; малко закъсня с натискането на спирачката; и еленът просто избяга от гъсталака отстрани на пътя. Изводът би бил, че инцидентът е просто инцидент.
Човекът обаче е пропуснал важен факт. По това време той изпращаше съобщения. Ако органите на реда знаеха за изпращането на текстови съобщения, това би променило причината за инцидента на невнимателно шофиране. Шофьорът може да бъде глобен и застрахователят ще използва различна причина, когато въвежда инцидента в базата данни. Както при невярната комисионна, получените грешни данни биха променили начина, по който застрахователната компания коригира премиите.
Избягването на погрешни истини за пропуск е почти невъзможно. Да, някой може нарочно да остави факти извън доклада, но е също толкова вероятно някой просто да забрави да включи всички факти. В крайна сметка повечето хора са доста разтревожени след инцидент, така че е лесно да загубите фокус и да докладвате само онези истини, които са оставили най-значително впечатление. Дори ако човек по-късно си спомни допълнителни подробности и ги докладва, малко вероятно е базата данни някога да съдържа пълен набор от истини.
Неистини на перспективата
Погрешни гледни точки възникват, когато множество страни гледат на инцидент от множество гледни точки. Например, при разглеждане на инцидент, включващ ударен пешеходец, лицето, управляващо колата, лицето, блъснато от колата, и страничен свидетел, който е станал свидетел на събитието, всички ще имат различни гледни точки. Служител, който приема доклади от всеки човек, разбираемо би получил различни факти от всеки, дори ако се предположи, че всеки човек казва истината, както всеки я знае. Всъщност опитът показва, че това е почти винаги така и това, което служителят представя като доклад, е средното положение на това, което всеки от участниците заявява, допълнено от личен опит. С други думи, докладът ще бъде близо до истината, но не достатъчно близо за AI.
Когато се занимавате с перспектива, важно е да вземете предвид гледната точка. Шофьорът на автомобила вижда арматурното табло и знае състоянието на автомобила към момента на инцидента. Това е информация, която липсва на другите две партии. По същия начин човекът, който е блъснат от колата, има най-добрата гледна точка, за да види изражението на лицето на водача (намерението). Случаят може да е в най-добрата позиция да види дали водачът е направил опит да спре и да прецени проблеми, като например дали шофьорът се е опитал да завие. Всяка страна ще трябва да направи отчет въз основа на видяни данни без ползата от скрити данни.
Перспективата е може би най-опасната от погрешните истини, защото всеки, който се опита да извлече истината в този сценарий, в най-добрия случай ще завърши със средна стойност от различните истории, които никога няма да бъдат напълно правилни. Човек, който разглежда информацията, може да разчита на интуиция и инстинкт, за да получи потенциално по-добро приближение на истината, но AI винаги ще използва само средната стойност, което означава, че AI винаги е в значително неизгодно положение. За съжаление, избягването на погрешни гледни точки е невъзможно, защото без значение колко свидетели имате на събитието, най-доброто, което можете да се надявате да постигнете, е приближаване на истината, а не на истинската истина.
Има и друг вид неистина, която трябва да се обмисли, и това е гледна точка. Помислете за този сценарий: Вие сте глух през 1927 г. Всяка седмица отивате на театър, за да гледате ням филм, и за час или повече се чувствате като всички останали. Можете да изживеете филма по същия начин, както всички останали; няма разлики. През октомври същата година виждате табела, която казва, че театърът се надгражда, за да поддържа звукова система, така че да може да показва разговори— филми със звуков запис. Табелата казва, че това е най-доброто нещо и изглежда почти всички са съгласни, с изключение на теб, глухият, който сега е накаран да се чувства като гражданин от втора класа, различен от всички останали и дори почти изключен от театъра . В очите на глухия този знак е неистина; добавянето на озвучителна система е възможно най-лошото нещо, а не най-доброто възможно. Въпросът е, че това, което изглежда като цяло вярно, всъщност не е вярно за всички. Идеята за обща истина – такава, която е вярна за всички – е мит. То не съществува.
Неистини на пристрастията
Погрешни истини за пристрастия възникват, когато някой е в състояние да види истината, но поради лични притеснения или вярвания не е в състояние да я види в действителност. Например, когато мисли за злополука, водачът може да фокусира вниманието толкова напълно в средата на пътя, че еленът на ръба на пътя става невидим. Следователно, водачът няма време да реагира, когато еленът внезапно реши да изскочи в средата на пътя в опит да го пресече.
Проблемът с пристрастията е, че може да бъде невероятно трудно да се категоризира. Например, шофьор, който не успее да види елена, може да претърпи истинска катастрофа, което означава, че еленът е бил скрит от поглед от храсти. Въпреки това, водачът може да е виновен и за невнимателно шофиране поради неправилен фокус. Шофьорът може също да изпита моментно разсейване. Накратко, фактът, че шофьорът не е видял елена, не е въпросът; вместо това е въпрос на това защо шофьорът не е видял елена. В много случаи потвърждаването на източника на отклонение става важно при създаването на алгоритъм, предназначен да избегне източник на отклонение.
Теоретично избягването на погрешни истини за пристрастия винаги е възможно. В действителност обаче всички хора имат пристрастия от различни видове и тези пристрастия винаги ще доведат до неистини, които изкривяват наборите от данни. Просто да накараш някой наистина да погледне и след това да види нещо - да го регистрира в мозъка на човека - е трудна задача. Хората разчитат на филтри, за да избегнат претоварване с информация, а тези филтри също са източник на пристрастия, защото пречат на хората да виждат нещата.
Референтна рамка
От петте погрешни истини референтната рамка всъщност не трябва да е резултат от някаква грешка, а от разбиране. Неистина в референтната рамка възниква, когато една страна описва нещо, като например събитие като злополука, и тъй като втора страна няма опит със събитието, детайлите стават объркани или напълно неразбрани. Има изобилие от комедийни съчетания, които разчитат на грешки в референтната рамка. Един известен пример е от Abbott and Costello, Who's On First? . Накарането на един човек да разбере какво казва вторият може да бъде невъзможно, когато на първия човек му липсват опитни познания - референтната рамка.
Друг пример за грешка в референтната рамка възниква, когато едната страна не може да разбере другата. Например, моряк преживява буря в морето. Може би това е мусон, но приемете за момент, че бурята е значителна - може би животозастрашаваща. Дори и с използването на видеозаписи, интервюта и симулатор, преживяването да си в морето в животозастрашаваща буря би било невъзможно да се предаде на някой, който не е преживявал такава буря от първа ръка; този човек няма референтна рамка.
Най-добрият начин да се избегнат неистини в референтната рамка е да се гарантира, че всички участващи страни могат да разработят подобни референтни рамки. За да изпълнят тази задача, различните страни изискват сходни опитни познания, за да осигурят точното прехвърляне на данни от едно лице на друго. Въпреки това, когато се работи с набор от данни, който задължително се записва, статични данни, грешки в референтната рамка все още ще се появяват, когато бъдещият зрител няма необходимите опитни познания.
ИИ винаги ще изпитва проблеми с референтната рамка, защото на ИИ непременно липсва способността да създава опит. Банката данни от придобити знания не е едно и също нещо. Банката от данни ще съдържа факти, но опитът се основава не само на факти, но и на заключения, които сегашната технология не е в състояние да дублира.