Як NaturallySpeaking вчиться розпізнавати мовлення

Комп’ютери дуже розумні, коли справа доходить до таких речей, які напружують мозок, як-от гра в шахи та заповнення податкових декларацій, тож ви можете подумати, що вони були б цікавими для «простих» дій, таких як розпізнавання облич або розуміння мови.

Але після приблизно 50 років спроб змусити комп’ютери виконувати ці прості речі, програмісти прийшли до висновку, що навички не є простими лише тому, що люди легко оволодівають ним. Насправді, наш мозок, очі та вуха переповнені складним сенсорним і обробним обладнанням, яке все ще обертається навколо всього, що ми можемо створити з кремнію та металу.

Ми, люди, думаємо, що розуміти мову легко, тому що вся справді важка робота виконується, перш ніж ми її усвідомлюємо. Нам здається, ніби англійські слова просто з’являються в наших головах, як тільки люди відкривають рот. Несвідома (або передсвідома) природа процесу робить подвійно важким для програмістів імітацію.

Щоб отримати уявлення про те, чому комп’ютери мають такі проблеми з мовленням, подумайте про те, що вони дуже добре розпізнають і розуміють: телефонні номери з тональним сигналом. Ці сигнали на телефонних лініях мають набагато більше значення для комп’ютерів, ніж для людей. Нижче наведено кілька важливих функцій, які роблять телефонні тональні сигнали легкою мовою для комп’ютерів. Англійська ж, навпаки, зовсім інша.

  • У «словнику» сенсорного тону всього 12 «слів». Після того, як ви знаєте тон для десяти цифр плюс * і #, ви перебуваєте. Англійська, з іншого боку, має сотні тисяч слів.

  • Жодне зі слів не звучить однаково. На телефоні з сенсорним тоном тон «1» чітко відрізняється від тону «7». Але в англійській мові є омоніми, наприклад, new і gnu, а також омоніми поруч, наприклад, merrier and marry her. Іноді цілі речення звучать однаково: наприклад, «Сини вирощують м’ясо» і «Промені сонця зустрічаються».

  • Усі «носії» мови вимовляють слова однаково. Натисніть кнопку 5 на будь-якому телефоні, і ви отримаєте точно такий же тон. Але літній чоловік і 10-річна дівчинка говорять дуже різними тонами; а люди з Великобританії, Канади та Сполучених Штатів вимовляють одні й ті ж англійські слова дуже по-різному.

  • Контекст безглуздий. Для телефону 1 — це 1 — це 1. Те, як ви інтерпретуєте тональний сигнал, не залежить від попереднього чи наступного номера. Але в письмовій англійській мові контекст – це все. Має сенс «поїхати в Нью-Йорк». Але набагато менше сенсу «побувати в Нью-Йорку» або «поїхати занадто Нью-Йорком».


10 поширених проблем, з якими стикається Dragon Professional Individual

10 поширених проблем, з якими стикається Dragon Professional Individual

Ось десять поширених проблем, з якими стикаються користувачі Dragon Professional Individual. Проблеми – це лише частина досвіду володіння чимось. І проблеми з програмним забезпеченням. . . вони лише частина досвіду. Період. Диктує, але нічого не відбувається Слова залишають твій рот, але вони не з’являються на екрані. Скажи кілька слів […]

Передача файлів з цифрового диктофона на NaturallySpeaking

Передача файлів з цифрового диктофона на NaturallySpeaking

Після запису диктанту на цифровий запис для використання з Dragon NaturallySpeaking, вам потрібно буде перенести цифровий файл із диктофона на ПК. Для передачі аудіофайлів на комп’ютер вам знадобляться інструкції від виробника рекордера. Він може мати власну програму для обробки передачі файлів, яка потрібна для […]

Як вирізати, вставити та скасувати в NaturallySpeaking

Як вирізати, вставити та скасувати в NaturallySpeaking

Редагування документа включає в себе кілька дій NaturallySpeaking: вставлення нового тексту, видалення тексту, заміну тексту диктуванням над ним і переупорядкування документа, вирізаючи текст з одного місця та вставляючи його в інше. За бажанням можна редагувати голосом. Вирізання та вставка голосом Щоб вирізати або скопіювати текст із […]

Керуйте інтервалом між абзацами в NaturallySpeaking

Керуйте інтервалом між абзацами в NaturallySpeaking

Dragon NaturallySpeaking автоматично виконує деякі інтервали між словами, реченнями та абзацами. Ви можете керувати цим інтервалом або додавати місце самостійно. Розуміння букви чи іншого документа залежить не лише від слів, а й від пробілів між словами. Розмістити ваш документ відносно легко. NaturallySpeaking має дві команди, які […]

Як NaturallySpeaking працює у фоновому режимі

Як NaturallySpeaking працює у фоновому режимі

NaturallySpeaking використовує кілька вікон одночасно. Зазвичай ви запускаєте програму, отримуєте вікно програми і працюєте в цьому вікні. Кінець історії. З NaturallySpeaking це не так, і неспроста: ви хочете мати можливість використовувати голосовий ввід у багатьох місцях, а не лише в одному вікні. Ядро […]

Як додати слова до Dragon Professional Individual з чужих документів

Як додати слова до Dragon Professional Individual з чужих документів

Зазвичай ви використовуєте власні документи, щоб навчати Dragon Professional Individual про свій словниковий запас. Але що ви можете зробити для теми, про яку ви мало писали? Відповідь: Візьміть слова з документів, написаних іншими людьми. В Інтернеті, наприклад, повно документів майже з будь-якої теми, яку ви можете назвати. Трюк […]

Як отримати технічну підтримку для Dragon Professional Individual по телефону

Як отримати технічну підтримку для Dragon Professional Individual по телефону

Якщо Dragon Professional Individual робить щось, чого ви дійсно не розумієте і йому важко пояснити, або якщо він робить щось, здавалося б, просте, але не дає вам інформації для роботи (наприклад, не вдається встановити або відмовляється відповідати), вам потрібно поговорити з співробітник технічної підтримки по телефону. Щоб визначити, що ви […]

Як перенести профілі користувачів Dragon

Як перенести профілі користувачів Dragon

DVD-диски не пам’ятають, чи були вони читані раніше, тому встановлення Dragon NaturallySpeaking на новий комп’ютер — це все одно, що інсталювати його вперше. Однак, якщо ви переносите свої профілі користувачів зі старої машини, ви не хочете повторювати загальне навчання. Натомість вийдіть із майстра нових користувачів одразу після того, як […]

Читайте електронну пошту та робіть нотатки за допомогою Dragon NaturallySpeaking

Читайте електронну пошту та робіть нотатки за допомогою Dragon NaturallySpeaking

Nuance зробив електронну пошту пріоритетом у Dragon NaturallySpeaking. Кілька голосових команд допомагають швидше виконувати завдання. Ви можете використовувати NaturallySpeaking, щоб читати вам свою електронну пошту та робити нотатки за допомогою Нотаток Outlook. Отримання вашої електронної пошти за допомогою NaturallySpeaking. Ваш помічник NaturallySpeaking може прочитати вашу електронну пошту. Хіба це не те, що […]

Чому вам знадобиться кілька профілів користувачів для Dragon Professional Individual

Чому вам знадобиться кілька профілів користувачів для Dragon Professional Individual

Dragon Professional Individual розуміє лише тих, хто офіційно представився як користувач і створив профіль користувача. Ось чотири причини, чому ви можете створити кілька профілів користувача для себе: ви використовуєте різні словники або стилі письма для різних завдань. Ви використовуєте різні мікрофони для різних завдань. Ти хочеш […]