Els ordinadors són molt intel·ligents quan es tracta d'esforçar el cervell en coses com jugar als escacs i omplir declaracions d'impostos, de manera que potser penseu que serien ximples en activitats "simples", com ara reconèixer cares o entendre la parla.
Però després d'uns 50 anys d'intentar que els ordinadors facin aquestes coses senzilles, els programadors han arribat a la conclusió que una habilitat no és senzilla només perquè els humans la dominen fàcilment. De fet, els nostres cervells, ulls i orelles estan plens d'equips de detecció i processament sofisticats que encara fan servir anells al voltant de qualsevol cosa que puguem dissenyar en silici i metall.
Els humans pensem que és fàcil d'entendre la parla perquè tot el treball dur es fa abans de prendre-ne consciència. Per a nosaltres, sembla com si les paraules en anglès se'ns apareguessin al cap tan bon punt la gent obria la boca. La naturalesa inconscient (o preconscient) del procés fa que sigui doblement difícil per als programadors informàtics imitar.
Per fer-vos una idea de per què els ordinadors tenen tants problemes amb la parla, penseu en alguna cosa que són molt bons per reconèixer i entendre: els números de telèfon de to tàctil. Aquests llamps i bloops a les línies telefòniques són molt més significatius per als ordinadors que per a les persones. Diverses funcions importants fan que els tons del telèfon siguin un llenguatge fàcil per a ordinadors, que s'enumeren a continuació. L'anglès, en canvi, és completament diferent.
-
El "vocabulari" de to tàctil només té 12 "paraules". Després de conèixer els tons dels deu dígits més * i #, ja esteu. L'anglès, en canvi, té centenars de milers de paraules.
-
Cap de les paraules sona igual. Al telèfon de to tàctil, el to "1" és clarament diferent del to "7". Però l'anglès té homònims, com new i gnu, i gairebé homònims, com merrier and marry her. De vegades, frases senceres sonen igual: “Els fills crien carn” i “Els raigs del sol es troben”, per exemple.
-
Tots els "parlants" de la llengua diuen les paraules de la mateixa manera. Premeu el botó 5 de qualsevol telèfon i obtindreu exactament el mateix to. Però un home gran i una nena de 10 anys utilitzen tons molt diferents quan parlen; i la gent de la Gran Bretanya, el Canadà i els Estats Units pronuncien les mateixes paraules angleses de maneres molt diferents.
-
El context no té sentit. Per al telèfon, un 1 és un 1 és un 1. La manera d'interpretar el to no depèn del número anterior o del número següent. Però en anglès escrit, el context ho és tot. Té sentit "anar a Nova York". Però té molt menys sentit "anar dos Nova York" o "anar massa Nova York".