Компјутери су веома паметни када су у питању ствари које напрежу мозак као што је играње шаха и попуњавање пореских пријава, тако да можете помислити да би били умеће у „једноставним“ активностима као што су препознавање лица или разумевање говора.
Али након око 50 година покушаја да натерају рачунаре да раде ове једноставне ствари, програмери су дошли до закључка да вештина није једноставна само зато што је људи лако савладају. У ствари, наши мозгови, очи и уши су препуни софистициране опреме за сензоре и обраду која се још увек врти око свега што можемо да дизајнирамо од силицијума и метала.
Ми људи мислимо да је једноставно разумети говор јер је сав заиста тежак посао обављен пре него што га постанемо свесни. Нама се чини као да нам енглеске речи падају у главу чим људи отворе уста. Несвесна (или предсвесна) природа процеса двоструко отежава компјутерским програмерима да опонашају.
Да бисте стекли представу о томе зашто рачунари имају толико проблема са говором, размислите о нечему што су веома добри у препознавању и разумевању: телефонским бројевима који се тонирају. Те мрље на телефонским линијама су много значајније за рачунаре него за људе. Неколико важних карактеристика чини тонове телефона лаким језиком за рачунаре, наведених у наставку. С друге стране, енглески је потпуно другачији.
-
Тонски „речник“ има само 12 „речи“. Након што знате тонове за десет цифара плус * и #, ушли сте. Енглески, с друге стране, има стотине хиљада речи.
-
Ниједна реч не звучи исто. На телефону са тонским звуком, тон „1“ се јасно разликује од тона „7“. Али енглески има хомониме, као што су нев и гну, и блиске хомониме, попут мерриер анд марри хер. Понекад целе реченице звуче слично: „Синови узгајају месо” и „Сунцеви зраци се сусрећу”, на пример.
-
Сви „говорници“ језика изговарају речи на исти начин. Притисните дугме 5 на било ком телефону и добићете потпуно исти тон. Али старији човек и 10-годишња девојчица користе веома различите тонове када говоре; а људи из Велике Британије, Канаде и Сједињених Држава изговарају исте енглеске речи на веома различите начине.
-
Контекст је бесмислен. За телефон, 1 је 1 је 1. Како тумачите тон не зависи од претходног или следећег броја. Али у писаном енглеском, контекст је све. Има смисла „ићи у Њујорк“. Али има много мање смисла „ићи два Њујорка“ или „ићи превише у Њујорк“.