IBM патентует новую систему преобразования текста в речь

 


Предложенный компанией IBM программно-аппаратный комплекс получил название "метод и система для интерактивной генерации ответов в центрах обработки вызовов с применением многоязыкового синтезатора речи" (method and system for interactively synthesizing call center responses using multi-language text-to-speech synthesizers). Соответствующая патентная заявка уже опубликована на сайте Управления США по патентам и торговым маркам (USPTO) и датирована 10 апреля нынешнего года.

Суть работы системы сводится к следующему. При поступлении голосового запроса в центр обработки вызовов специализированные средства будут анализировать и распознавать речь. Параллельно система определит телефонный номер пользователя и сопоставит его с географической базой данных. На основе это информации комплекс сможет сделать вывод о местонахождении абонента и речевых особенностях (например, акценте) жителей данного региона. Далее система сгенерирует ответ в текстовом виде, а синтезатор речи воспроизведет его на нужном языке, подстроившись под конкретного пользователя.

Предполагается, что новая технология IBM повысит удобство работы с автоматизированными центрами обработки вызовов для тех абонентов, которые разговаривают с акцентом или на диалектах местных языков. Кроме того, появление унифицированной системы, способной учитывать особенности речи пользователей, теоретически позволит сократить затраты на развертывание и поддержание работы call-центров. Впрочем, о сроках практического применения системы IBM пока ничего не сообщается.


Источник: Компьюлента