5 помилок у даних для штучного інтелекту

Люди звикли бачити дані такими, якими вони є в багатьох випадках: думками. Насправді, в деяких випадках люди спотворюють дані до такої міри, що вони стають марними, це неправда. Комп’ютер або програма зі штучним інтелектом не можуть відрізнити правдиві дані від неправдивих — вони бачать лише дані. Однією з проблем, яка ускладнює, якщо взагалі неможливим, створення штучного інтелекту, який насправді думає як людина, полягає в тому, що люди можуть працювати з неправдами, а комп’ютери — ні. Найкраще, на що ви можете сподіватися, — це побачити помилкові дані як викиди, а потім відфільтрувати їх, але ця техніка не обов’язково вирішує проблему, тому що людина все одно буде використовувати дані та намагатися визначити істину на основі хибних істин, які є там.

Поширена думка про створення менш забруднених наборів даних полягає в тому, що замість того, щоб дозволяти людям вводити дані, має бути можливий збір даних за допомогою датчиків або інших засобів. На жаль, датчики та інші механічні методології введення відображають цілі їх людських винахідників і межі того, що конкретна технологія здатна виявити. Таким чином, навіть дані, отримані машинами або датчиками, також можуть генерувати помилки, які ШІ досить важко виявити та подолати.

У наступному обговоренні використовується автомобільна аварія як основний приклад, щоб проілюструвати п’ять типів неправди, які можуть з’являтися в даних. Концепції, які намагається зобразити аварія, можуть не завжди з’являтися в даних, і вони можуть виглядати інакше, ніж обговорювалося. Факт залишається фактом, що зазвичай вам потрібно мати справу з такими речами під час перегляду даних.

Помилки комісії

Неправдивими вважаються ті, що відображають відверту спробу замінити правдиву інформацію неправдивою. Наприклад, заповнюючи звіт про нещасний випадок, хтось міг заявити, що сонце на мить засліпило їх, унеможлививши побачити когось, кого вони вдарили. Насправді, можливо, людина була відволіклася на щось інше або насправді не думала про водіння (можливо, розглянувши смачну вечерю). Якщо ніхто не зможе спростувати цю теорію, людина може обійтися меншою платою. Проте справа в тому, що дані також будуть забруднені. Внаслідок цього страхова компанія буде базувати внески на основі помилкових даних.

Хоча здавалося б, ніби неправдивості доручення цілком можна уникнути, часто це не так. Людина розповідає «маленьку білу брехню», щоб позбавити інших збентеження або вирішити проблему з найменшими особистими зусиллями. Іноді хибна інформація про комісію ґрунтується на хибних висновках або чутках. Насправді джерел помилок при здійсненні комісій настільки багато, що дійсно важко придумати сценарій, коли хтось міг би їх повністю уникнути. Все це говорить про те, що неправда щодо доручення є одним із видів неправди, якого найчастіше можна уникнути.

Неправда про упущення

Неправда про упущення — це ті, коли людина говорить правду в кожному викладеному факті, але не враховує важливий факт, який змінив би сприйняття інциденту в цілому. Знову подумавши про протокол ДТП, скажіть, що хтось вдарив оленя, завдавши значної шкоди його машині. Він правдиво каже, що дорога була мокра; було близько сутінків, тому світло було не таким хорошим, як могло бути; він трохи запізнився з натисканням на гальмо; а олень просто вибіг із гущавини на узбіччі дороги. Висновок був би, що інцидент є просто нещасним випадком.

Однак людина пропустила важливий факт. У той час він писав повідомлення. Якби правоохоронні органи знали про текстове повідомлення, причину аварії змінили б на неуважне водіння. Водія можуть оштрафувати, а страховий налагоджувач використає іншу причину при внесенні інциденту в базу даних. Як і у випадку з хибністю комісії, отримані помилкові дані можуть змінити те, як страхова компанія коригує премії.

Уникнути неправдивих упущень практично неможливо. Так, хтось міг би навмисне виключити факти зі звіту, але так само ймовірно, що хтось просто забуде включити всі факти. Зрештою, більшість людей після аварії досить збентежені, тому легко втратити фокус і повідомити лише ті істини, які залишили найзначніше враження. Навіть якщо пізніше людина згадає додаткові деталі та повідомить про них, навряд чи база даних коли-небудь міститиме повний набір істин.

Неправда перспективи

Похибка точки зору виникає, коли кілька сторін розглядають інцидент з різних точок зору. Наприклад, розглядаючи аварію за участю збитого пішохода, особи, яка керує автомобілем, людини, яку збила машина, та випадкового перехожого, який був свідком події, усі мають різні точки зору. Зрозуміло, що офіцер, який бере звіти від кожної людини, отримає різні факти від кожного, навіть якщо припустити, що кожна людина говорить правду так, як кожен її знає. Насправді досвід показує, що це майже завжди так, і те, що офіцер подає як звіт, є середньою основою того, що кожен із причетних стверджує, доповнений особистим досвідом. Іншими словами, звіт буде близьким до істини, але недостатньо близьким для ШІ.

Маючи справу з перспективою, важливо враховувати точку зору. Водій автомобіля бачить приладову панель і знає стан автомобіля на момент аварії. Це інформація, якої не вистачає двом іншим партіям. Аналогічно, людина, яку збила машина, має найкращу точку зору, щоб побачити вираз обличчя водія (намір). Перехожий може бути в найкращому положенні, щоб побачити, чи зробив водій спробу зупинитися, і оцінити проблеми, наприклад, чи намагався водій звернути. Кожна сторона повинна буде скласти звіт на основі побачених даних без використання прихованих даних.

Перспектива є, мабуть, найнебезпечнішою з хиб, тому що кожен, хто намагається вивести правду в цьому сценарії, в кращому випадку отримає середнє значення різних історій, яке ніколи не буде повністю правильним. Людина, яка розглядає інформацію, може покладатися на інтуїцію та інстинкт, щоб потенційно отримати кращу апроксимацію істини, але ШІ завжди буде використовувати лише середнє значення, а це означає, що ШІ завжди перебуває у суттєвому невигідному становищі. На жаль, уникнути хибної точки зору неможливо, тому що незалежно від того, скільки у вас є свідків події, найкраще, на що ви можете сподіватися, — це наближення до істини, а не до фактичної правди.

Існує також інший вид неправди, який слід розглянути, і це одна з точки зору. Подумайте про такий сценарій: ви глухий у 1927 році. Щотижня ви ходите в театр, щоб подивитися німий фільм, і протягом години чи більше ви відчуваєте себе, як усі. Ви можете відчути фільм так само, як і всі інші; відмінностей немає. У жовтні того ж року ви бачите табличку про те, що кінотеатр оновлюється, щоб підтримувати звукову систему, щоб вона могла показувати розмови— фільми зі звуковою доріжкою. На табличці написано, що це найкраще, і майже всі з цим погоджуються, крім вас, глухої людини, яку тепер змушують почуватися громадянином другого сорту, відмінним від усіх інших і навіть майже виключеним з театру . В очах глухої людини цей знак — неправда; Додавання звукової системи – це найгірша річ, а не найкраща. Справа в тому, що те, що здається істинним, насправді вірно не для всіх. Ідея загальної істини — істинної для всіх — є міфом. Його не існує.

Помилки упередженості

Помилка упередженості виникає, коли хтось може побачити істину, але через особисті проблеми чи переконання не може її побачити. Наприклад, думаючи про аварію, водій може так повністю зосередити увагу на середині дороги, що олень на краю дороги стає невидимим. Отже, водій не встигає зреагувати, коли олень раптом вирішує вискочити на середину дороги, намагаючись перетнути.

Проблема упередженості полягає в тому, що її може бути неймовірно важко класифікувати. Наприклад, водій, який не бачить оленя, може потрапити в аварію, тобто олень був прихований від очей чагарниками. Однак водій також може бути винним у неуважному водінні через неправильне фокусування. Водій також може на хвилину відволіктися. Коротше кажучи, те, що водій не бачив оленя, це не питання; натомість справа в тому, чому водій не бачив оленя. У багатьох випадках підтвердження джерела зміщення стає важливим при створенні алгоритму, призначеного для уникнення джерела зміщення.

Теоретично уникнути неправди упередженості завжди можливо. Насправді, однак, у всіх людей є упередження різних типів, і ці упередження завжди призведуть до неправди, яка спотворює набори даних. Просто змусити когось по-справжньому подивитися, а потім побачити щось — зареєструвати це в мозку людини — є складним завданням. Люди покладаються на фільтри, щоб уникнути перевантаження інформацією, і ці фільтри також є джерелом упередженості, оскільки вони не дозволяють людям насправді бачити речі.

Система відліку

З п’яти хиб, система відліку насправді не повинна бути результатом якоїсь помилки, а є результатом розуміння. Неправда в системі відліку виникає, коли одна сторона описує щось, наприклад подію, як нещасний випадок, і оскільки друга сторона не має досвіду роботи з подією, деталі стають плутаними або повністю неправильно зрозумілими. Є багато комедійних рутин, які покладаються на помилки системи відліку. Одним із відомих прикладів є книга Еббота і Костелло « Хто перший?» . Змусити одну людину зрозуміти, що говорить друга людина, неможливо, якщо першій не вистачає досвіду — системи відліку.

Інший приклад помилки в системі відліку виникає, коли одна сторона не може зрозуміти іншу. Наприклад, моряк переживає шторм на морі. Можливо, це мусон, але припустимо на мить, що шторм сильний — можливо, небезпечний для життя. Навіть із використанням відео, інтерв’ю та симулятора досвід перебування на морі під час небезпечного для життя шторму неможливо було б передати тому, хто не відчував такого шторму на власні очі; ця особа не має системи орієнтації.

Найкращий спосіб уникнути помилок у системі відліку – це забезпечити, щоб усі залучені сторони могли розробити подібні системи відліку. Для виконання цього завдання різні сторони потребують подібних знань, щоб забезпечити точну передачу даних від однієї особи до іншої. Однак під час роботи з набором даних, який обов’язково записується, статичними даними, помилки кадру посилань все одно виникатимуть, коли потенційному глядачеві не вистачає необхідних досвіду.

ШІ завжди буде відчувати проблеми з системою відліку, оскільки ШІ обов’язково не має можливості створити досвід. Банк даних набутих знань – це не те саме. Банк даних містив би факти, але досвід базується не тільки на фактах, а й на висновках, які нинішня технологія не може повторити.


Огляд Snagit 2018 Що нового з версії 13

Огляд Snagit 2018 Що нового з версії 13

TechSmith Snagit — наше улюблене програмне забезпечення для створення скріншотів і редагування зображень. Перегляньте нові функції в Snagit 2018!

8 онлайн-інструментів для малювання діаграм і блок-схем

8 онлайн-інструментів для малювання діаграм і блок-схем

Потрібно створити діаграми або блок-схеми і не хочете встановлювати додаткове програмне забезпечення? Ось список онлайн-інструментів для створення діаграм.

Spotify не може відтворити поточну пісню? Як виправити

Spotify не може відтворити поточну пісню? Як виправити

Мати дім, повний бездротових пристроїв і потокових служб, таких як Spotify, — це чудово, доки все не запрацює, а ви знайдете цікаві рішення.

Що таке NVMe M.2 SSD і наскільки він швидкий?

Що таке NVMe M.2 SSD і наскільки він швидкий?

NVMe M.2 SSD — це найновіша технологія комп’ютерних жорстких дисків. Що це таке та наскільки він швидкий порівняно зі старими жорсткими дисками та твердотільними накопичувачами (SSD)?

Sonos проти AirPlay: Чому я вибрав AirPlay для аудіосистеми всього будинку

Sonos проти AirPlay: Чому я вибрав AirPlay для аудіосистеми всього будинку

Sonos — це ідеальне рішення для потокового аудіо від 400 доларів США за два динаміки. Але за правильного налаштування AirPlay може бути безкоштовним. Давайте розглянемо деталі.

Додаток Google Backup and Sync замінює Photos і Drive

Додаток Google Backup and Sync замінює Photos і Drive

Google Backup and Sync – це нова програма, яка синхронізується з Фото та Диском. Читайте далі, щоб побачити, як він протистоїть OneDrive, Dropbox, Backblaze і Crashplan.

Розрізання кабелю: огляд MyIPTV із SOPlayer

Розрізання кабелю: огляд MyIPTV із SOPlayer

MyIPTV — це служба розрізання кабелю, яка використовує програму SOPlayer для кількох платформ і надає телебачення, фільми та інші форми медіа за плату.

Клавіатура Logitech K830 для вітальні з підсвічуванням

Клавіатура Logitech K830 для вітальні з підсвічуванням

Logitech нещодавно випустила клавіатуру K830 з підсвічуванням для вітальні, призначену для домашнього розваги. Ось наш огляд агрегату.

Оновлено CloudHQ: швидша синхронізація, редагування файлів Dropbox із Google Docs

Оновлено CloudHQ: швидша синхронізація, редагування файлів Dropbox із Google Docs

Ось подивіться на нещодавно випущене оновлення для CloudHQ і як воно працює. Читайте далі, щоб дізнатися більше.

Що таке Android-телефон OnePlus 6T?

Що таке Android-телефон OnePlus 6T?

OnePlus 6T — флагманський Android-телефон преміум-класу, який продається зі знижкою порівняно з Apple iPhone, Google Pixel 3 або Samsung Galaxy S9.