IBM совершает революцию в области распознавания речи

 


Корпорация IBM объявила о революционном достижении в области голосовых технологий, которое позволит водителям автомобилей и пользователям карманных ПК управлять аппаратными средствами с помощью естественного языка, освободив их от необходимости заучивания специфических, заранее определенных команд.
Новый компонент программного пакета IBM Embedded ViaVoice 4.4 позволяет значительно усовершенствовать технологии голосового управления для карманных устройств и навигационных систем автомобилей. При этом обеспечивается большая гибкость системы и точность выполнения указаний пользователя. Прежде, для того чтобы взаимодействовать с системами распознавания речи, пользователям требовалось изучить, запомнить и использовать фиксированный набор фраз и команд. Теперь, благодаря разработанной IBM новой технологии, для управления радиоприемником водитель может просто сказать, например: «настроиться на частоту 104,3», или «установить приемник на частоту 104,3», или «изменить радиостанцию на 104,3». Чтобы настроить радиоприемник на желаемую волну, можно использовать самые разнообразные, простые и понятные фразы, поэтому больше не нужно запоминать набор специфических команд.
Пакет IBM Embedded ViaVoice 4.4 включает компонент freeform command recognition (распознавание команд в свободной форме), использующий передовые средства статистического языкового моделирования и семантической интерпретации, чтобы обеспечить взаимодействие между пользователем и системой распознавания голоса в радиоприемниках, навигационных системах автомобиля или карманных ПК на естественном языке.
Кроме того, новый пакет обеспечивает значительное повышение точности распознавания голоса на фоне любых шумов благодаря использованию новых акустических моделей, усовершенствованным методикам обучения акустическим моделям и улучшенному определению границы речь/тишина с учетом различных случайных шумов (неровности дорожного покрытия, сирены, пересечение железнодорожной линии и т.д.).
Распознавание множества языков, более естественное использование
Новые пользователи могут легко приступить к использованию этой системы, а водители не утруждать себя запоминанием специфических слов или выражений и сконцентрироваться на управлении автомобилем. Больше свободно будут чувствовать себя и пользователи карманных ПК. Кроме того, новая система не только позволяет использовать команды в свободной форме, но и распознает команды на многих языках.
«В последние годы технология распознавание речи неоднократно подвергалась суровой критике, однако постепенно она превращается в действительно полезный инструмент. Мы видим новую волну интереса к подобным системам, — говорит Джим Холланд (Jim Holland), менеджер по встроенным голосовым технологиям подразделения IBM Software Group. — Возможность отдавать команды на естественном языке позволяет упростить работу с голосовыми устройствами для выполнения повседневных задач и отражает наше стремление предоставлять пользователям информацию и функциональные возможности как готовый к использованию сервис, вне зависимости от среды».
ПО IBM Embedded ViaVoice Version 4.4 предлагает передовые голосовые технологии для мобильных устройств, таких как навигационные системы автомобилей, телефоны с голосовым управлением, карманные ПК и других интеллектуальных устройств. Встраиваемые приложения могут использовать голосовые технологии IBM как для автоматического распознавания речи (Automatic Speech Recognition, ASR), чтобы вводить команды в мобильные устройства, так и для преобразования текста в речь (Text-To-Speech, TTS), чтобы синтезировать голос человека для воспроизведения текста и другой информации из мобильного устройства.