Datamaskiner er veldig smarte når det kommer til hjernetrengende ting som å spille sjakk og fylle ut selvangivelser, så du kan tro at de vil suse på «enkle» aktiviteter som å gjenkjenne ansikter eller forstå tale.
Men etter omtrent 50 år med forsøk på å få datamaskiner til å gjøre disse enkle tingene, har programmerere kommet til den konklusjon at en ferdighet ikke er enkel bare fordi mennesker mestrer den lett. Faktisk er hjernen, øynene og ørene våre proppfulle av sofistikert sanse- og prosesseringsutstyr som fortsatt kjører ringer rundt alt vi kan designe i silisium og metall.
Vi mennesker tror det er enkelt å forstå tale fordi alt det virkelig harde arbeidet er gjort før vi blir bevisste på det. For oss virker det som om engelske ord bare dukker opp i hodet vårt så snart folk åpner munnen. Prosessens ubevisste (eller førbevisste) natur gjør det dobbelt vanskelig for dataprogrammerere å etterligne.
For å få en ide om hvorfor datamaskiner har slike problemer med tale, tenk på noe de er veldig flinke til å gjenkjenne og forstå: telefonnumre med trykktone. Disse blippene og bloopene på telefonlinjene er mye mer meningsfulle for datamaskiner enn de er for folk. Flere viktige funksjoner gjør telefontonene til et enkelt språk for datamaskiner, oppført nedenfor. Engelsk er derimot en helt annen.
-
Berøringstone-"vokabularet" har bare 12 "ord" i seg. Etter at du kjenner tonene for de ti sifrene pluss * og #, er du i. Engelsk har derimot hundretusenvis av ord.
-
Ingen av ordene høres like ut. På touch-tone-telefonen er "1"-tonen tydelig forskjellig fra "7"-tonen. Men engelsk har homonymer, som new og gnu, og nær homonymer, som merrier og marry henne. Noen ganger høres hele setninger likt ut: «Sønnene hever kjøtt» og «Solens stråler møtes», for eksempel.
-
Alle «talere» av språket sier ordene på samme måte. Trykk på 5-knappen på hvilken som helst telefon, og du får nøyaktig samme tone. Men en eldre mann og en 10 år gammel jente bruker svært forskjellige toner når de snakker; og folk fra Storbritannia, Canada og USA uttaler de samme engelske ordene på svært forskjellige måter.
-
Kontekst er meningsløs. For telefonen er en 1 en 1 er en 1. Hvordan du tolker tonen avhenger ikke av forrige nummer eller neste nummer. Men på skriftlig engelsk er kontekst alt. Det er fornuftig å "dra til New York." Men det gir mye mindre mening å "gå to New York" eller "gå for New York."