Компютрите са много умни, когато става въпрос за натоварващи мозъка неща, като игра на шах и попълване на данъчни декларации, така че може да си помислите, че ще бъдат шеметни в „прости“ дейности като разпознаване на лица или разбиране на речта.
Но след около 50 години опити да накарат компютрите да правят тези прости неща, програмистите стигнаха до заключението, че едно умение не е просто, само защото хората го овладяват лесно. Всъщност мозъкът ни, очите и ушите ни са пълни с усъвършенствано сензорно и обработващо оборудване, което все още се върти около всичко, което можем да проектираме от силиций и метал.
Ние, хората, смятаме, че е лесно да разберем речта, защото цялата наистина упорита работа се извършва, преди да я осъзнаем. На нас ни се струва, че английските думи просто изникват в главите ни веднага щом хората отворят устата си. Несъзнателният (или предсъзнателен) характер на процеса прави двойно по-трудно за компютърните програмисти да имитират.
За да добиете представа защо компютрите имат такива проблеми с говора, помислете за нещо, което са много добри в разпознаването и разбирането: телефонни номера с тонално докосване. Тези светкавици по телефонните линии са много по-значими за компютрите, отколкото за хората. Няколко важни функции правят тоновете на телефона лесен език за компютри, изброени по-долу. Английският, от друга страна, е съвсем различен.
-
„Речникът“ за докосване има само 12 „думи“. След като знаете тоновете за десетте цифри плюс * и #, вие сте в. Английският, от друга страна, има стотици хиляди думи.
-
Нито една от думите не звучи еднакво. На телефона със сензорен тон тонът „1“ е ясно различен от тон „7“. Но английският има омоними, като new и gnu, и близки омоними, като Merrier и се ожени за нея. Понякога цели изречения звучат еднакво: „Синовете отглеждат месо“ и „Слънчевите лъчи се срещат“, например.
-
Всички „говорещи“ на езика казват думите по един и същи начин. Натиснете бутона 5 на всеки телефон и ще получите точно същия тон. Но възрастен мъж и 10-годишно момиче използват много различни тонове, когато говорят; и хора от Великобритания, Канада и Съединените щати произнасят едни и същи английски думи по много различни начини.
-
Контекстът е безсмислен. За телефона 1 е 1 е 1. Как интерпретирате тона не зависи от предходния номер или следващия номер. Но в писмения английски контекстът е всичко. Има смисъл „да отидете в Ню Йорк“. Но има много по-малко смисъл да отидете на два Ню Йорк или да отидете твърде Ню Йорк.