Комп’ютери дуже розумні, коли справа доходить до таких речей, які напружують мозок, як-от гра в шахи та заповнення податкових декларацій, тож ви можете подумати, що вони були б цікавими для «простих» дій, таких як розпізнавання облич або розуміння мови.
Але після приблизно 50 років спроб змусити комп’ютери виконувати ці прості речі, програмісти прийшли до висновку, що навички не є простими лише тому, що люди легко оволодівають ним. Насправді, наш мозок, очі та вуха переповнені складним сенсорним і обробним обладнанням, яке все ще обертається навколо всього, що ми можемо створити з кремнію та металу.
Ми, люди, думаємо, що розуміти мову легко, тому що вся справді важка робота виконується, перш ніж ми її усвідомлюємо. Нам здається, ніби англійські слова просто з’являються в наших головах, як тільки люди відкривають рот. Несвідома (або передсвідома) природа процесу робить подвійно важким для програмістів імітацію.
Щоб отримати уявлення про те, чому комп’ютери мають такі проблеми з мовленням, подумайте про те, що вони дуже добре розпізнають і розуміють: телефонні номери з тональним сигналом. Ці сигнали на телефонних лініях мають набагато більше значення для комп’ютерів, ніж для людей. Нижче наведено кілька важливих функцій, які роблять телефонні тональні сигнали легкою мовою для комп’ютерів. Англійська ж, навпаки, зовсім інша.
-
У «словнику» сенсорного тону всього 12 «слів». Після того, як ви знаєте тон для десяти цифр плюс * і #, ви перебуваєте. Англійська, з іншого боку, має сотні тисяч слів.
-
Жодне зі слів не звучить однаково. На телефоні з сенсорним тоном тон «1» чітко відрізняється від тону «7». Але в англійській мові є омоніми, наприклад, new і gnu, а також омоніми поруч, наприклад, merrier and marry her. Іноді цілі речення звучать однаково: наприклад, «Сини вирощують м’ясо» і «Промені сонця зустрічаються».
-
Усі «носії» мови вимовляють слова однаково. Натисніть кнопку 5 на будь-якому телефоні, і ви отримаєте точно такий же тон. Але літній чоловік і 10-річна дівчинка говорять дуже різними тонами; а люди з Великобританії, Канади та Сполучених Штатів вимовляють одні й ті ж англійські слова дуже по-різному.
-
Контекст безглуздий. Для телефону 1 — це 1 — це 1. Те, як ви інтерпретуєте тональний сигнал, не залежить від попереднього чи наступного номера. Але в письмовій англійській мові контекст – це все. Має сенс «поїхати в Нью-Йорк». Але набагато менше сенсу «побувати в Нью-Йорку» або «поїхати занадто Нью-Йорком».