Computere er meget smarte, når det kommer til hjernespændende ting som at spille skak og udfylde selvangivelser, så du tror måske, de vil suse på "simple" aktiviteter som at genkende ansigter eller forstå tale.
Men efter omkring 50 års forsøg på at få computere til at gøre disse simple ting, er programmører kommet til den konklusion, at en færdighed ikke er enkel, bare fordi mennesker mestrer den let. Faktisk er vores hjerner og øjne og ører fyldt med sofistikeret sansnings- og behandlingsudstyr, der stadig kører ringe rundt om alt, hvad vi kan designe i silicium og metal.
Vi mennesker tror, det er nemt at forstå tale, fordi alt det virkelig hårde arbejde er gjort, før vi bliver bevidste om det. For os virker det, som om engelske ord bare dukker op i vores hoveder, så snart folk åbner munden. Processens ubevidste (eller førbevidste) karakter gør det dobbelt svært for computerprogrammører at efterligne.
For at få en idé om, hvorfor computere har sådanne problemer med tale, skal du tænke på noget, de er meget gode til at genkende og forstå: telefonnumre med tryktoner. Disse blips og bloops på telefonlinjerne er meget mere betydningsfulde for computere, end de er for mennesker. Flere vigtige funktioner gør telefontonerne til et nemt sprog for computere, som er angivet nedenfor. Engelsk er derimod helt anderledes.
-
Berøringstone-"ordforrådet" har kun 12 "ord" i sig. Når du kender tonerne for de ti cifre plus * og #, er du i gang. Engelsk har på den anden side hundredtusindvis af ord.
-
Ingen af ordene lyder ens. På touch-tone-telefonen er "1"-tonen tydeligt forskellig fra "7"-tonen. Men engelsk har homonymer, såsom new og gnu, og næsten homonymer, som merrier og marry her. Nogle gange lyder hele sætninger ens: "Sønnerne hæver kød" og "Solens stråler mødes", for eksempel.
-
Alle sprogets "talere" siger ordene på samme måde. Tryk på 5-knappen på enhver telefon, og du får nøjagtig den samme tone. Men en ældre mand og en 10-årig pige bruger meget forskellige toner, når de taler; og folk fra Storbritannien, Canada og USA udtaler de samme engelske ord på meget forskellige måder.
-
Kontekst er meningsløs. For telefonen er et 1 et 1 er et 1. Hvordan du fortolker tonen afhænger ikke af det foregående nummer eller det næste nummer. Men på skriftlig engelsk er kontekst alt. Det giver mening at "gå til New York." Men det giver meget mindre mening at "gå to New York" eller "gå for New York."