Изображение: Istock
Тренд речевых технологий и больших языковых моделей ускоряет развитие ИИ
Согласно исследованию Brandessence, глобальный рынок разговорного искусственного интеллекта (ИИ) вырастет с $8,2 млрд в 2023 г. до $32,5 млрд в 2028 г. Объем российского рынка оценивается в десятки миллионов долларов, но активно растет. Один из драйверов – потребность крупного бизнеса и госсектора в улучшении качества коммуникаций с клиентами, сокращении издержек на содержание контакт-центров за счет речевых технологий, машинного обучения и нейросетей. Крупный бизнес уже использует речевую аналитику, диалоговых ассистентов, биометрию, а появление новейших больших языковых моделей (LLM от англ. Large Language Model), таких как GigaChat, усиливает спрос и становится мощным катализатором рынка.
Эволюция речевой аналитики
Объем мирового рынка речевой аналитики в 2022 г. составил $2,3 млрд, следует из данных Markets & Markets. К 2027 г. он достигнет $5,1 млрд при годовых темпах роста 17,3%. По данным исследования информационно-аналитического агентства Telecom Daily, в 2024–2025 гг. российский рынок речевой аналитики в среднем вырастет на 15%, в том числе за счет внедрения новых технологий. По доле выручки в On-Premise внедрениях (установка на оборудование клиента в противоположность On-Cloud – облачной установке. – Ред.) речевой аналитики в крупном бизнесе лидирует группа компаний ЦРТ (33,2%), которая практически в 2 раза опережает идущую следом BSS (17,5%), далее следует 3iTech (10,6%), подсчитали аналитики Telecom Daily.
Массив звонков, которые поступают в контактные центры, обрабатывают операторы. Изучить все записи человеку крайне утомительно, и здесь помогают технологии: распознавание речи позволяет перевести звонки в текст, а речевая аналитика – провести анализ для улучшения клиентского опыта. С помощью обратной связи клиентов можно выявить зоны автоматизации, повысить эффективность голосовых ассистентов и чат-ботов.
Так, недавно группа ЦРТ объявила о разработке SpeechXplore – нового отечественного решения на основе ИИ, где применяются передовые технологии, в том числе нейросетевая модель GigaChat, интегрированная посредством программного интерфейса GigaChat API. Алгоритмы машинного обучения увеличили скорость обработки и анализа обращений клиентов в контактный центр, а инструменты анализа на основе ИИ создают дополнительные возможности исследования: помогают суммаризировать содержание и тематики диалогов, оценивать их результативность и тональность. Данные агрегируются, расшифровываются и анализируются в онлайн-режиме, прямо в момент обращения клиента. Это позволяет оператору давать более точные ответы на запросы. Онлайн речевая аналитика помогает прогнозировать клиентские предпочтения, реагировать на них проактивно.
LLM способны совершить мощный технологический прорыв.
«Оценив потенциал LLM, мы планируем усилить и другие свои продукты, включая диалоговых ассистентов, нейросетевой моделью GigaChat, что даст возможность нашим клиентам из крупного бизнеса и госсектора умножить эффективность речевых технологий. Такое развитие приближает концепцию AI-driven (управляемые ИИ. – Ред.) контактных центров, где рутинные процедуры можно будет делегировать ИИ в полной мере. Мы инвестируем в эту стратегию уже сейчас». Дмитрий Дырмовский, генеральный директор группы ЦРТ.
Тренд подтверждают и другие эксперты. LLM за счет краткой выжимки из диалога помогут быстрее обрабатывать повторные обращения потребителей. Клиенту не потребуется повторять вопрос, потому что сотрудник увидит, какие рекомендации ранее давал его коллега. «Мы уже провели успешный пилот использования ML-моделей (моделей машинного обучения. – Ред.) при обслуживании в Центре клиентского сервиса и сейчас работаем над его внедрением», – рассказал представитель «Мегафона».
Представитель «Мосэнергосбыта» отметил среди трендов в речевой аналитике учет контекста и генеративный ИИ. Учет контекста важен при классификации запроса пользователя, ведь зачастую неточность формулировок вопроса пользователем такова, что только из контекста можно понять, что хотел обратившийся, продолжил он. «Традиционная форма предоставления заранее подготовленного ответа из базы знаний может не учитывать все нюансы заданного вопроса. На наш взгляд, генеративный ИИ сглаживает общение, делая ответы более точными и доступными для понимания», – указал представитель энергокомпании.
В MTS AI считают, что многие компании в будущем автоматизируют клиентскую поддержку через подключение генеративных моделей для общения с клиентом на первой линии. По мнению представителя компании, тренды на автоматизацию клиентской поддержки и использование генеративного ИИ будут усиливаться в ближайшие год-два.
Актуальность внедрения ИИ-решений в области речевых технологий подтвердил и директор по развитию отношений с клиентами «Ингосстраха» Сергей Багно. «Мы используем решения главным образом для транскрипции диалогов и чат-ботов. Эффективность оценивается по метрике WER (процент неправильно распознанных слов), которая в настоящий момент составляет менее 11%», – сказал он. «Ингосстрах» планирует сфокусироваться на развитии продуктов по речевой аналитике и транскрипции за счет применения открытых моделей, добавил Багно.
Диалог с роботом
Использование чат-ботов и ассистентов сокращает время получения ответа пользователями любого сервиса. Если клиентов много, то это незаменимое решение. Генеративный ИИ расширил возможности и этих систем.
«LLM помогут создавать ассистентов без ручного обучения и добиться технологических прорывов. Также растет количество запросов на выбор из нескольких мужских и женских голосов, возможность кастомизации, создание фирменных голосов». Дмитрий Дырмовский, генеральный директор группы ЦРТ.
Реагируя на спрос, группа ЦРТ представила синтез речи нового поколения: удалось добиться максимальной реалистичности речи с настройкой эмоций и интонаций, а также значительно ускорить процесс разработки.
«Команда MTS AI разработала и внедрила решение для контакт-центра МТС, сочетающее в себе технологии речевой аналитики, синтеза и распознавания речи. Также внедрены такие решения, как чат- и голосовой бот на базе продуктов MTS AI. В результате на 96% повысилась точность распознавания запросов пользователей, на 43% снизилась стоимость целевого лида (стоимость привлечения человека, готового купить продукт компании прямо сейчас или в ближайшем будущем. – Ред.), удовлетворенность клиентов выросла на 20%, а продажи – на 25%», – заключил представитель MTS AI.
В «Мегафоне» используется речевая аналитика входящих и исходящих контактов с абонентами, виртуальный голосовой помощник «Елена» и чат-бот «Елена», сообщил представитель телекомкомпании. «Речевая аналитика на текущий момент охватывает более 90% всех голосовых входящих и исходящих контактов с клиентами. С помощью инструмента мы быстро и системно понимаем, что беспокоит потребителей, и принимаем решения о внедрении новых идей и продуктов. Виртуальному помощнику «Елене» поступает примерно 200 000 звонков в сутки. Для качественного обслуживания такого объема обращений мы развиваем автоматизацию с использованием технологий NLU (самообучение машины речи для естественного звучания. – Ред.), а также синтеза и распознавания речи», – рассказали в «Мегафоне».
Использование этих технологий помогает не только оптимизировать работу, но и улучшить клиентский путь, сделать диалоги с помощником вариативными, приближенными к человеческим, указал представитель «Мегафона». По его словам, 70% клиентов не ждут оператора, потому что на их вопросы отвечает «Елена».
Роботы приходят на подмогу и сотрудникам «Мегафона». Например, робот – помощник по проверке качества связи сократил время диалога с клиентом на 51 секунду и улучшил достоверность диагностики качества связи. «В обучении персонала мы применяем голосовые роботы-тренажеры, с помощью которых сотрудники могут потренироваться в обслуживании клиентов», – резюмировал представитель компании. «Поставщиком речевой аналитики является группа ЦРТ, распознавание и синтез речи – Яндекс», добавил он.
В банковской сфере использование ИИ и речевых технологий – актуальный тренд для контакт-центров, голосовых ассистентов в мобильных приложениях, суммаризации неструктурированных объемов данных и пр., указала вице-президент, руководитель департамента клиентского обслуживания ВТБ Ольга Цегельная.
ВТБ использует решения группы ЦРТ, указала она. «ИИ нового поколения позволяет роботам лучше имитировать человеческое поведение, проявлять эмпатию и чувство юмора, применять адаптивные сценарии под каждый запрос пользователя», – сказала она. Сейчас ВТБ создает персональный синтез речи для голосового ассистента на входящей линии контакт-центра. Тестовый запуск новых сценариев с применением современных моделей ИИ привел к улучшению практически всех метрик качества, таких как длительность обслуживания, уровень автоматизации и удовлетворенность клиентов, сказала Цегельная.
По ее словам, система речевой аналитики ежедневно проверяет абсолютно все контакты (звонки и чаты) с клиентами на предмет соблюдения стандартов общения, правильности консультирования, проявления эмпатии, реализации этапов продаж продуктов операторами контакт-центра. «На основе результатов автоматизированного контроля строится система мотивации операторов и менеджмента. За три года применения системы речевой аналитики CSI (индекс удовлетворенности. – Ред.) клиентов, обращающихся в контакт-центр, улучшился на 44%», – добавила она.
Тренд на масштабирование
Лидеры среди отраслей по использованию ИИ для автоматизации процессов – финтех и телеком. Порядка 50% компаний из этих отраслей уже внедрили ИИ и около 20–30% планируют сделать это в течение следующих 2–3 лет, указал представитель MTS AI. Речевые технологии применяются в ритейле, ТЭКе, АПК, транспорте. Например, при поверке составов или приборов на производстве используются бейджи для надиктовки показателей, добавил он.
Усиливается тренд face2face-аналитики: клиенты стремятся перенести успешный опыт применения речевой аналитики в контактных центрах на офисы продаж и обслуживания.
Распознавание речи используется и в других сферах. Например, решение Voice2Med в здравоохранении – голосовое заполнение медицинских протоколов – экономит более 20% времени врача, а при заполнении направления на медико-социальную экспертизу экономия времени составляет свыше 50%. Такое решение точечно используется уже в 68 регионах России. Растет интерес к голосовому вводу в промышленности и других отраслях.
Источник: https://www.vedomosti.ru/technologies/new_technologies/articles/2023/11/13/1005245-golosa-zovut