5-те погрешни истини в данните за изкуствен интелект

Хората са свикнали да виждат данните каквито са в много случаи: мнение. Всъщност в някои случаи хората изкривяват данните до точката, в която стават безполезни, лъжа. Компютърно или AI приложение не може да направи разликата между верни и неверни данни - всичко, което вижда, са данни. Един от проблемите, които правят трудно, ако не и невъзможно, създаването на AI, който всъщност мисли като човек, е, че хората могат да работят с неистини, а компютрите не могат. Най-доброто, което можете да се надявате да постигнете, е да видите грешните данни като отклонения и след това да ги филтрирате, но тази техника не решава непременно проблема, защото човек все пак ще използва данните и ще се опита да определи истина въз основа на погрешните истини, които има ли.

Често срещана мисъл за създаване на по-малко замърсени набори от данни е, че вместо да се позволи на хората да въвеждат данните, събирането на данните чрез сензори или други средства трябва да бъде възможно. За съжаление, сензорите и други методологии за механично въвеждане отразяват целите на техните изобретатели и границите на това, което конкретната технология е в състояние да открие. Следователно, дори извлечените от машини или сензори данни също са обект на генериране на неистини, които са доста трудни за AI за откриване и преодоляване.

Следващата дискусия използва автомобилна катастрофа като основен пример, за да илюстрира пет вида неистини, които могат да се появят в данните. Концепциите, които произшествието се опитва да изобрази, може да не винаги се появяват в данните и може да се появят по различни начини от обсъжданите. Фактът остава, че обикновено трябва да се справяте с подобни неща, когато преглеждате данни.

Неистини на Комисията

Неистините за извършване на поръчка са тези, които отразяват откровен опит за замяна на истинска информация с невярна информация. Например, когато попълва доклад за злополука, някой може да заяви, че слънцето за момент го е заслепило, което прави невъзможно да се види някой, когото е ударил. В действителност, може би човекът е бил разсеян от нещо друго или всъщност не е мислил за шофиране (вероятно обмисляйки хубава вечеря). Ако никой не може да опровергае тази теория, човекът може да се справи с по-малка такса. Въпросът обаче е, че данните също биха били замърсени. Ефектът е, че сега една застрахователна компания ще базира премиите на грешни данни.

Въпреки че изглежда, че погрешните истини за комисионна са напълно избегнати, често не са. Човек казва „малки бели лъжи“, за да спести смущението на другите или да се справи с проблем с най-малко лично усилие. Понякога лъжата в комисионната се основава на грешни данни или слухове. Всъщност източниците за грешки при комисионните са толкова много, че наистина е трудно да се измисли сценарий, при който някой би могъл да ги избегне напълно. Всичко това казано, погрешните истини за комисионна са един вид неистина, която някой може да избягва по-често, отколкото не.

Погрешни истини за пропускане

Погрешните истини за пропускане са тези, при които човек казва истината във всеки изложен факт, но пропуска важен факт, който би променил възприемането на инцидента като цяло. Помислете отново за доклада за произшествието, кажете, че някой удря елен, причинявайки значителни щети на колата му. Той честно казва, че пътят е бил мокър; беше близо до здрач, така че светлината не беше толкова добра, колкото би могла да бъде; малко закъсня с натискането на спирачката; и еленът просто избяга от гъсталака отстрани на пътя. Изводът би бил, че инцидентът е просто инцидент.

Човекът обаче е пропуснал важен факт. По това време той изпращаше съобщения. Ако органите на реда знаеха за изпращането на текстови съобщения, това би променило причината за инцидента на невнимателно шофиране. Шофьорът може да бъде глобен и застрахователят ще използва различна причина, когато въвежда инцидента в базата данни. Както при невярната комисионна, получените грешни данни биха променили начина, по който застрахователната компания коригира премиите.

Избягването на погрешни истини за пропуск е почти невъзможно. Да, някой може нарочно да остави факти извън доклада, но е също толкова вероятно някой просто да забрави да включи всички факти. В крайна сметка повечето хора са доста разтревожени след инцидент, така че е лесно да загубите фокус и да докладвате само онези истини, които са оставили най-значително впечатление. Дори ако човек по-късно си спомни допълнителни подробности и ги докладва, малко вероятно е базата данни някога да съдържа пълен набор от истини.

Неистини на перспективата

Погрешни гледни точки възникват, когато множество страни гледат на инцидент от множество гледни точки. Например, при разглеждане на инцидент, включващ ударен пешеходец, лицето, управляващо колата, лицето, блъснато от колата, и страничен свидетел, който е станал свидетел на събитието, всички ще имат различни гледни точки. Служител, който приема доклади от всеки човек, разбираемо би получил различни факти от всеки, дори ако се предположи, че всеки човек казва истината, както всеки я знае. Всъщност опитът показва, че това е почти винаги така и това, което служителят представя като доклад, е средното положение на това, което всеки от участниците заявява, допълнено от личен опит. С други думи, докладът ще бъде близо до истината, но не достатъчно близо за AI.

Когато се занимавате с перспектива, важно е да вземете предвид гледната точка. Шофьорът на автомобила вижда арматурното табло и знае състоянието на автомобила към момента на инцидента. Това е информация, която липсва на другите две партии. По същия начин човекът, който е блъснат от колата, има най-добрата гледна точка, за да види изражението на лицето на водача (намерението). Случаят може да е в най-добрата позиция да види дали водачът е направил опит да спре и да прецени проблеми, като например дали шофьорът се е опитал да завие. Всяка страна ще трябва да направи отчет въз основа на видяни данни без ползата от скрити данни.

Перспективата е може би най-опасната от погрешните истини, защото всеки, който се опита да извлече истината в този сценарий, в най-добрия случай ще завърши със средна стойност от различните истории, които никога няма да бъдат напълно правилни. Човек, който разглежда информацията, може да разчита на интуиция и инстинкт, за да получи потенциално по-добро приближение на истината, но AI винаги ще използва само средната стойност, което означава, че AI винаги е в значително неизгодно положение. За съжаление, избягването на погрешни гледни точки е невъзможно, защото без значение колко свидетели имате на събитието, най-доброто, което можете да се надявате да постигнете, е приближаване на истината, а не на истинската истина.

Има и друг вид неистина, която трябва да се обмисли, и това е гледна точка. Помислете за този сценарий: Вие сте глух през 1927 г. Всяка седмица отивате на театър, за да гледате ням филм, и за час или повече се чувствате като всички останали. Можете да изживеете филма по същия начин, както всички останали; няма разлики. През октомври същата година виждате табела, която казва, че театърът се надгражда, за да поддържа звукова система, така че да може да показва разговори— филми със звуков запис. Табелата казва, че това е най-доброто нещо и изглежда почти всички са съгласни, с изключение на теб, глухият, който сега е накаран да се чувства като гражданин от втора класа, различен от всички останали и дори почти изключен от театъра . В очите на глухия този знак е неистина; добавянето на озвучителна система е възможно най-лошото нещо, а не най-доброто възможно. Въпросът е, че това, което изглежда като цяло вярно, всъщност не е вярно за всички. Идеята за обща истина – такава, която е вярна за всички – е мит. То не съществува.

Неистини на пристрастията

Погрешни истини за пристрастия възникват, когато някой е в състояние да види истината, но поради лични притеснения или вярвания не е в състояние да я види в действителност. Например, когато мисли за злополука, водачът може да фокусира вниманието толкова напълно в средата на пътя, че еленът на ръба на пътя става невидим. Следователно, водачът няма време да реагира, когато еленът внезапно реши да изскочи в средата на пътя в опит да го пресече.

Проблемът с пристрастията е, че може да бъде невероятно трудно да се категоризира. Например, шофьор, който не успее да види елена, може да претърпи истинска катастрофа, което означава, че еленът е бил скрит от поглед от храсти. Въпреки това, водачът може да е виновен и за невнимателно шофиране поради неправилен фокус. Шофьорът може също да изпита моментно разсейване. Накратко, фактът, че шофьорът не е видял елена, не е въпросът; вместо това е въпрос на това защо шофьорът не е видял елена. В много случаи потвърждаването на източника на отклонение става важно при създаването на алгоритъм, предназначен да избегне източник на отклонение.

Теоретично избягването на погрешни истини за пристрастия винаги е възможно. В действителност обаче всички хора имат пристрастия от различни видове и тези пристрастия винаги ще доведат до неистини, които изкривяват наборите от данни. Просто да накараш някой наистина да погледне и след това да види нещо - да го регистрира в мозъка на човека - е трудна задача. Хората разчитат на филтри, за да избегнат претоварване с информация, а тези филтри също са източник на пристрастия, защото пречат на хората да виждат нещата.

Референтна рамка

От петте погрешни истини референтната рамка всъщност не трябва да е резултат от някаква грешка, а от разбиране. Неистина в референтната рамка възниква, когато една страна описва нещо, като например събитие като злополука, и тъй като втора страна няма опит със събитието, детайлите стават объркани или напълно неразбрани. Има изобилие от комедийни съчетания, които разчитат на грешки в референтната рамка. Един известен пример е от Abbott and Costello, Who's On First? . Накарането на един човек да разбере какво казва вторият може да бъде невъзможно, когато на първия човек му липсват опитни познания - референтната рамка.

Друг пример за грешка в референтната рамка възниква, когато едната страна не може да разбере другата. Например, моряк преживява буря в морето. Може би това е мусон, но приемете за момент, че бурята е значителна - може би животозастрашаваща. Дори и с използването на видеозаписи, интервюта и симулатор, преживяването да си в морето в животозастрашаваща буря би било невъзможно да се предаде на някой, който не е преживявал такава буря от първа ръка; този човек няма референтна рамка.

Най-добрият начин да се избегнат неистини в референтната рамка е да се гарантира, че всички участващи страни могат да разработят подобни референтни рамки. За да изпълнят тази задача, различните страни изискват сходни опитни познания, за да осигурят точното прехвърляне на данни от едно лице на друго. Въпреки това, когато се работи с набор от данни, който задължително се записва, статични данни, грешки в референтната рамка все още ще се появяват, когато бъдещият зрител няма необходимите опитни познания.

ИИ винаги ще изпитва проблеми с референтната рамка, защото на ИИ непременно липсва способността да създава опит. Банката данни от придобити знания не е едно и също нещо. Банката от данни ще съдържа факти, но опитът се основава не само на факти, но и на заключения, които сегашната технология не е в състояние да дублира.

За възрастни: Как да вмъкнете изрезки в слайд на PowerPoint

Клипартът е предварително нарисувано общо произведение на изкуството и Microsoft предоставя много файлове с клипарт безплатно със своите продукти на Office. Можете да вмъкнете изрезки в оформлението на слайда на PowerPoint. Най-лесният начин да вмъкнете клип арт е като използвате един от заместителите в оформлението на слайда: Покажете слайд, който съдържа клипарт […]

За възрастни: Как да запълните цвят в Microsoft Excel

Цвят на запълване — наричан още засенчване — е цветът или моделът, който запълва фона на една или повече клетки на работния лист на Excel. Прилагането на засенчване може да помогне на очите на читателя да следват информацията в цялата страница и може да добави цвят и визуален интерес към работния лист. В някои видове електронни таблици, като например регистър на чековите книжки, […]

Добавяне на нови контакти в Act! 2005 г

На най-простото ниво, основната цел на ACT! е да служи като място за съхранение на всички контакти, с които взаимодействате ежедневно. Можете да добавяте и редактирате всичките си контакти от прозореца Подробности за контакт, защото съдържа цялата информация, която се отнася до един конкретен запис и […]

Discord For LuckyTemplates Cheat Sheet

Използвайте този Cheat Sheet, за да преминете директно към използването на Discord. Открийте полезни Discord ботове, приложения, които можете да интегрирате, и съвети за интервюиране на гости.

OpenOffice.org за LuckyTemplates Cheat Sheet

Офис пакетът OpenOffice.org има много инструменти за улесняване на работния живот. Когато работите в OpenOffice.org, запознайте се с функционалната лента с инструменти (която изглежда почти еднакво във всички приложения) и главните бутони на лентата с инструменти за помощ с основните команди за повечето задачи.

Машината за бомби на Алън Тюринг

Машината Bombe на Алън Тюринг не беше никаква форма на изкуствен интелект (AI). Всъщност това дори не е истински компютър. Счупи криптографските съобщения на Enigma и това е всичко. Това обаче даде повод за размисъл за Тюринг, което в крайна сметка доведе до документ, озаглавен „Компютърни машини и интелигентност“?? която той публикува през 50-те години на миналия век, която описва […]

Стандартни хардуерни дефицити за изкуствен интелект

Възможността за създаване на модулна система има значителни предимства, особено в бизнеса. Възможността за премахване и замяна на отделни компоненти поддържа разходите ниски, като същевременно позволява постепенни подобрения както в скоростта, така и в ефективността. Въпреки това, както при повечето неща, няма безплатен обяд. Модулността, осигурена от архитектурата на фон Нойман, идва с някои […]

10 правила, които не трябва да правите при използване на QuarkXPress

Ако трябва да изберете десет лесни за забравяне, но изключително полезни неща, които да запомните за QuarkXPress, тези в следващия списък, скъпи читателю, биха били те. Намасте. Говорете с вашия търговски принтер. Всички проекти за печат започват и завършват с принтера. Това е така, защото само принтерите знаят своите ограничения и хилядите начини, по които един проект може да бъде […]

Произходът на биткойн

Най-важният аспект на биткойн може да е концепцията зад него. Биткойн е създаден от разработчика Сатоши Накамото. Вместо да се опитва да създаде изцяло нов метод на плащане, за да премахне начина, по който всички плащаме за нещата онлайн, Сатоши видя някои проблеми със съществуващите платежни системи и искаше да ги разреши. Концепцията за […]

Как да защитите поверителността си, когато използвате биткойн

Известно ниво на анонимност е обвързано с използването на биткойн и цифровата валута като цяло. Дали можете да го обозначите като „достатъчно анонимен“ е лично мнение. Има начини да защитите поверителността си, когато използвате биткойн за преместване на средства, но те изискват известно усилие и планиране: Можете да генерирате нов адрес за […]