Datorer är väldigt smarta när det kommer till hjärnansträngande saker som att spela schack och fylla i skattedeklarationer, så du kanske tror att de skulle gnälla över "enkla" aktiviteter som att känna igen ansikten eller förstå tal.
Men efter cirka 50 års försök att få datorer att göra dessa enkla saker, har programmerare kommit till slutsatsen att en färdighet inte är enkel bara för att människor behärskar den lätt. Faktum är att våra hjärnor och ögon och öron är fulla av sofistikerad avkännings- och bearbetningsutrustning som fortfarande kör ringar runt allt vi kan designa i kisel och metall.
Vi människor tror att det är enkelt att förstå tal eftersom allt det riktigt hårda arbetet är gjort innan vi blir medvetna om det. För oss verkar det som om engelska ord bara dyker upp i våra huvuden så fort folk öppnar munnen. Processens omedvetna (eller förmedvetna) karaktär gör det dubbelt svårt för datorprogrammerare att härma.
För att få en uppfattning om varför datorer har sådana problem med tal, tänk på något som de är väldigt bra på att känna igen och förstå: telefonnummer med pektoner. Dessa blippar och bloopar på telefonlinjerna är mycket mer meningsfulla för datorer än de är för människor. Flera viktiga funktioner gör telefontonerna till ett enkelt språk för datorer, listade nedan. Engelskan däremot är en helt annan.
-
Touch-tonen "vokabulär" har bara 12 "ord" i sig. När du känner till tonerna för de tio siffrorna plus * och #, är du i. Engelska, å andra sidan, har hundratusentals ord.
-
Inget av orden låter likadant. På touch-tone-telefonen är "1"-tonen tydligt skild från "7"-tonen. Men engelska har homonymer, som new och gnu, och nära homonymer, som merrier och marry her. Ibland låter hela meningar lika: "Sönerna föder kött" och "Solens strålar möts", till exempel.
-
Alla "talare" av språket säger orden på samma sätt. Tryck på 5-knappen på valfri telefon och du får exakt samma ton. Men en äldre man och en 10-årig flicka använder väldigt olika toner när de pratar; och människor från Storbritannien, Kanada och USA uttalar samma engelska ord på väldigt olika sätt.
-
Sammanhanget är meningslöst. För telefonen är en 1 en 1 är en 1. Hur du tolkar tonen beror inte på föregående nummer eller nästa nummer. Men på skriftlig engelska är sammanhanget allt. Det är vettigt att "åka till New York." Men det är mycket mindre vettigt att "åka två New York" eller "åka för New York."