НП РУССОФТ выпустил новое ежегодное исследование индустрии разработки ПО в России.
Экспертное мнение Дмитрия Дырмовского, CEO группы ЦРТ — в блоке «Технологии»:
Искусственный интеллект (ИИ) остается технологическим драйвером развития отраслей экономики. Глобальный рынок к 2022 году достиг объема в $136,6 млрд (GrandViewResearch), а к 2030 году составит $1,8 трлн с CAGR 38.1% (при 34,3% в прошлом году).
Возрастает рост вариативности сценариев с ИИ. Этому способствовало технологическое развитие: раскрывается потенциал ИИ-трансформеров, появляются новые архитектуры — wav2vec, HuBERT, а также рост доступных объёмов данных для аналитики и совершенствование обучения ML-моделей. Новые подходы развивают разговорный ИИ: позволяют увеличить согласованность слов, корректировать окончания, знаки препинания, удалять «речевой шум» — оговорки, перебивания, слова-паразиты и автоматически исправлять ошибки. Все это приводит к упрощению применения распознавания речи. В результате существенно усложняются и задачи, где ИИ дает высокий результат: расширяется сфера применения цифровых сервисов для массового обслуживания — голосовые помощники уже могут помочь рассчитать налоги, проверить документы или конкретную информацию, предоставить документы и справки, выполняя сквозные коммерческие или государственные функции.
Среди трендов:
• Востребованность анализа данных внутренних коммуникаций
Возросла ценность данных по результату совещаний: принятые решения, поручения, статусы проектов и др. С ростом количества совещаний — особенно в онлайн — растёт сфера применения распознавания речи участников внутренних совещаний. Развивается применение постобработки результатов распознавания для повышения читаемости: корректировка окончаний, исправление неправильно распознанных слов. Расширяется применение NLU для автоматического выделения и формирования итогов и followup совещаний без привлечения человека.
• Роботы становятся более естественными
Диалоговые ассистенты в контактных центрах приобретают возможности для предвосхищения намерений по ходу разговора, будут все глубже работать с контекстом и эмоциями, подстраиваясь под целевую аудиторию, развивая персонификацию сервисов — и в крупном бизнесе, и в госсекторе.
• Креативный и генеративный ИИ
Успех генеративных AI-моделей показывает, что применение таких подходов для создания принципиально нового контента становится все более актуальным. Наряду с генерацией текстов, картин и музыки, ИИ в перспективе сможет почти мгновенно создать нужный аудио и видео контент в направлении виртуальных аватаров компаний.
• Решения на основе лицевой и голосовой биометрии интегрируются в разные сферы по всему миру. Развиваются технологии антиспуфинга (защиты от различных типов атак)
Для защиты лицевой биометрии развиваются технологии liveness detection, а речевое машинное обучение позволяет с высокой эффективностью выявлять голосовые дипфейки. ИИ используется для выявления в общении паттернов мошенничества, помогая им противостоять.
• Роль ИИ смещается: переход от автоматизации задач к упрощению и ускорению работы сотрудников
Голосовой ИИ становится ядром привычных процессов и дает возможность кардинального изменения качества привычных услуг без изменения инфраструктуры, увеличивая продуктивность.
Источник: https://russoft.org/wp-content/uploads/2022/12/survey2022.pdf (стр. 161)