Компания «ЦРТ-инновации» представляет новую технологию голосового управления в условиях зашумленности

20.05.2016

Резидент Сколково «ЦРТ-инновации» (группа компаний ЦРТ) при поддержке Министерства образования и науки РФ разработала технологию автоматического распознавания речевых команд для робототехники и промышленности. Новая технология использует метод распознавания команд по грамматикам с использованием акустических моделей на основе глубоких нейронных сетей (Deep neural networks, DNN).

Искусственные нейронные сети, организованные по принципу функционирования биологических нейронных сетей – нервных клеток живого организма, имеют самый широкий спектр применения: в математике, кибернетике, вычислительной технике и программировании и, безусловно, в машинном обучении, связанном с распознаванием образов, речи, речевых команд. И одним из наиболее актуальных применений DNN сегодня, когда потребность в диалоге «человек-машина» стала очевидной, видится именно распознавание естественной звучащей речи.

Голосовое управление в промышленных условиях предполагает повышенную зашумленность, поэтому требовалось создать технологию, которая сумела бы отличать речь от шума и адаптироваться к конкретному человеку. Технология группы компаний ЦРТ решает эти задачи за счет алгоритма определения речевой активности диктора на основе нейросетевого классификатора и нового метода адаптации к голосу и каналу.

Новая технология может использоваться для голосового управления станками в шумных заводских цехах, грузовыми автомобилями и другой техникой, работающей на стройках, разработках и в карьерах,  для распознавания команд в шумных многолюдных помещениях.  

«Последние значительные успехи в распознавании речи связаны с применением в акустических моделях глубоких нейронных сетей вместо смесей гауссовых распределений. Результаты проведенных компанией исследований показывают значительное преимущество распознавания речи на базе глубоких нейронных сетей. Это преимущество наиболее ярко проявляется  в условиях увеличения шума», - прокомментировал директор научно-исследовательского департамента ЦРТ Кирилл Левин.

Продукты и решения на основе технологии распознавания речи – одно из основных направлений работы группы компаний ЦРТ. В их числе сиcтема голосового взаимодействия VoiceNavigator, система речевой аналитики на основе машинного обучения Smart Logger II и другие. 

Подписаться на новости:

подписаться

Поделиться:

Другие новости

РБК Тренды: 10 кейсов применения GenAI в бизнесе

СomNews: «В 2025 г. искусственный интеллект начнет лучше понимать человека»

GigaChat поможет КАПИТАЛ LIFE трансформировать рынок страхования жизни и создать новые стандарты обслуживания клиентов

Все новостиподписаться

Карта сайта

Продукты

Партнёрам