Разработанный «ЦРТ-инновации» программный комплекс для голосового распознавания команд в робототехнике готов к тестированию

04.11.2015

Компания «ЦРТ-инновации» (резидент «Сколково», дочерняя компания ЦРТ) работает над созданием технологии распознавания команд в робототехнике с 2014 года. Разработка субсидируется Министерством образования и науки РФ в рамках прикладных научных исследований «Разработка технологии преобразования русской речи в транскрипционное представление с метаданными для автоматического распознавания речевых команд в робототехнике и промышленности» (ПНИ "Распознавание команд в робототехнике и промышленности").

На сегодняшний день созданный «ЦРТ-инновации» программный комплекс автоматического распознавания речевых команд функционирует без подключения к сети Интернет в операционных системах Windows и Android. Лежащие в основе работы программного комплекса алгоритмы были апробированы на международном конкурсе CHiME 2015 и в коммерческих задачах.

Использовать программу предполагается для внедрения голосового управления автомобилями и другими транспортными средствами, промышленной техникой (например, станками) и как встраиваемый модуль в сервисных роботах.

В качестве индустриального партнера «ЦРТ-инновации», планирующего активно использовать новую программу в своих решениях и проектах, выступает компания «Центр речевых технологий» (ЦРТ).

За год работы в рамках прикладных исследований R&D команда «ЦРТ-инновации» добилась значительных успехов: было существенно улучшено качество распознавания речи и команд в сложной акустической обстановке. Сюда относятся такие задачи, как: распознавание речи и команд удаленного источника и распознавание речи и команд в условиях сильных шумов.

Решение этих задач было обеспечено такими собственными разработками, как:  
• многоканальная обработка - комплекс аппаратных и алгоритмических средств, обеспечивающих пространственную избирательность системы распознавания речи и увеличение отношения сигнал-шум в интересующем направлении; 
• помехоустойчивый детектор речевой активности; 
• помехоустойчивые акустические модели (комплекс алгоритмов, обеспечивающих извлечение устойчивых к различным видам искажений представлений речевого сигнала и адаптацию нейросетевых акустических моделей к изменяющимся условиям).

«Разработка надежного голосового управления техникой – очень важная задача. Есть ситуации, когда без голосового управления нельзя обеспечить безопасность оператора. Например, в условиях неблагоприятной для человека среды. Или когда у оператора заняты руки, или он находится в условиях наблюдения сразу за несколькими объектами. Малейшее отвлечение в подобных ситуациях может стоить оператору жизни. И именно поэтому эта задача является одной из приоритетных для «ЦРТ-инновации», - прокомментировал исполнительный директор компании Алексей Яковлев.

Подписаться на новости:

подписаться

Поделиться:

Другие новости

Как генеративный искусственный интеллект умножает эффективность бизнеса

Группа ЦРТ представила бот-платформу с генеративным искусственным интеллектом

AI-решение группы ЦРТ с применением нейросетевой модели GigaChat вошло в тройку лучших на международном конкурсе БРИКС

Все новостиподписаться

Карта сайта

Продукты

Партнёрам