В «историческом достижении» Microsoft в области распознавания речи использованы разработки резидента «Сколково» компании «ЦРТ-инновации»
31.10.2016
Группа исследователей Microsoft в области искусственного интеллекта опубликовала научную статью по автоматическому распознаванию телефонных разговоров американцев. Согласно отчету, ошибка распознавания составила 5,9% — то есть более 94% слов система распознаёт верно. Такой же результат в аналогичных условиях показали профессиональные стенографисты.
«Мы достигли уровня человека. Это историческое достижение», — заявил главный инженер исследовательской группы Microsoft по работе с искусственным интеллектом Сюэдунь Хуань (Xuedong Huang).
Ранее корпорация уже публиковала результаты экспериментов по распознаванию на стандартном наборе тестов «НИСТ-2000». Тогда им удалось снизить ошибку до 6,3% — и до показателей живого человека оставалось улучшить результат на 0,4%. Учёные добились этого к середине октября. Последний рывок в повышении качества распознавания удалось сделать благодаря модернизации архитектуры искусственного интеллекта, основанного на нейронных сетях.
В опубликованной несколько дней назад статье исследователи из Microsoft сообщают, что наибольший вклад в улучшение результата внесло использование метода, предложенного Группой ЦРТ на международной конференции Interspeech сентябре 2016 года в Сан-Франциско.
Кирилл Левин, руководитель научно-исследовательского департамента ЦРТ:
«Мы использовали моделирование человеческого языка многослойными рекуррентными нейронными сетями с блоками долговременной и кратковременной памяти (long short term memory). Они позволяют учитывать дальний смысловой контекст в предложениях. Это заметно снижает количество ошибок распознавания».
На сегодняшний день набор алгоритмов, разработанный учёными группы ЦРТ, занимает третье место в мире по качеству распознавания речи американцев в лабораторных условиях. Российские технологии уступают только последним разработкам IBM и Microsoft.
Сергей Ходаков, руководитель направления «Безопасные информационные технологии» ИТ-кластера Фонда «Сколково»:
«Достижение уровня точности распознавания речи, сопоставимый с точностью человека,- важный шаг к созданию новых технологий и продуктов, направленных на решение задач автоматизации предоставления сервисов и обеспечения безопасности. Считаю, что признание технологий разработанных “ЦРТ-инновации” со стороны ведущий компании является отличной рекомендаций, подтверждающей инновационность и высокий коммерческий потенциал российских разработок. Это достижение поможет нашему резиденту укрепить свои позиции в России и успешно продолжить коммерциализацию на международном рынке».
Подписаться на новости:
подписатьсяДругие новости
Чат-бот Московского метро Александра ответил на 7 млн вопросов и стал лауреатом CX World Awards
Группа компаний ЦРТ создала голос на основе нейросетей для героя фильма «Сто лет тому вперед»
Видеокамеры добавят узнаваемости
Подписка на новости
Для того чтобы получить подписаться на рассылку новостей, необходимо заполнить следующие поля: