blurred-figure-green
blurred-figure-violet
Автоматизация звонков: новые технологии и перспективы развития
Вернуться назад

В чем отличие голосового робота на основе скриптов от GenAI-ассистента?

Владельцы бизнеса все чаще используют голосовых роботов для автоматизации взаимодействий со своими клиентами. Но не все понимают разницу между скриптовыми решениями и роботами на основе GenAI (генеративного ИИ).

Владельцы бизнеса все чаще используют голосовых роботов для автоматизации взаимодействий со своими клиентами. Но не все понимают разницу между скриптовыми решениями и роботами на основе GenAI (генеративного ИИ).

Компания Fromtech является разработчиком новейших решений в области голосовых технологий, которые она внедряет и тестирует прямо сейчас в своих проектах. 

В чем ключевая разница между скриптовым роботом и GenAI?

 

Скриптовый робот

  • Работает по заранее прописанным сценариям.
  • Не может отклониться от скрипта.
  • Подходит для решения массовых и однотипных задач (напоминания, подтверждение заказов).
  • Быстро внедряется и дешевле в разработке.
  • Идеально работает при предсказуемых ветках сценария.


GenAI-робот

  • На данный момент продукт на основе данной технологии еще не выведен на рынок и находится на стадии тестирования.
  • Использует искусственный интеллект (например, GPT, Llama).
  • Понимает контекст, поддерживает естественный диалог, не дает понять клиенту, что с ним разговаривает робот.
  • Может анализировать ответы и подстраиваться под клиента.
  • Подходит для сложных сценариев (переговоры, консультации).
  • Задержки могут снизить эффективность диалога. Fromtech минимизирует их за счёт технологии Realtime-инференса и тонкой настройки стека..
  • Технически намного более сложный продукт, чем голосовой робот на основе скриптов.

 

Краткий вывод: Скриптовый робот — это структурированный агент, который работает по заданным сценариям. GenAI-робот — это адаптивный собеседник, способный генерировать ответы в свободной форме.

 

Технологии, которые тестируются в GenAI

 

RAG (Retrieval-Augmented Generation) — Технология, которая позволяет сгенерировать ответ когда человек задает вопрос, который не был прописан в скрипте заранее. Для этого он использует данные из сторонних источников: находит нужную справку, регламент или текст из базы знаний

Что делает: Ищет нужные данные (например, в интернете или базе) и на их основе дает точный ответ.

 

Пример: Если спросить у чат-бота: «Какие новости про ИИ?», он сначала найдет свежие статьи, а потом сформулирует ответ.

 

VAD (Voice Activity Detection) — Детектор голосовой активности

Что делает: Определяет, когда человек говорит, а когда молчит.

Пример: В Zoom, когда вы говорите, система автоматически включает микрофон (и выключает, когда молчите) — это VAD.

 

Инновационные технологии голосовых роботов от Fromtech

 

Технология Realtime (LLM + VAD)

Fromtech внедряет технологию realtime: робот начинает генерировать ответ ещё до окончания фразы клиента, сокращая паузы и улучшая ритм диалога.

Используется Realtime VAD (Voice Activity Detection) — детектор голосовой активности, который «слушает» в фоне, пока робот говорит. Позволяет ему прерываться и подстраиваться под речь клиента (например, если тот передумал или перебил).

 

Перебивание, адаптация речи и отсутствие задержек

Одна из ключевых особенностей Fromtech-роботов — возможность перебить его в диалоге, так как они умеют останавливаться на полуслове, если человек начал говорить и минимизируют задержки в ответах. В этом помогает технология Fromtech – Realtime-LLM, которая уже тестируется во многих проектах. Ведь даже пауза в одну секунду может дать понять клиенту, что он разговаривает с роботом. Для устранения этих проблем Fromtech тестирует sentence completeness модели для чего используется собственный стек ASR + TTS + inference LLM на on-premise.

 

Как работает перебивание и адаптация речи с точки зрения технологии:

  • Пока звучит фраза, VAD отслеживает, не начал ли говорить клиент;
  • Если клиент перебивает — фраза прерывается, NLU обрабатывает новую реплику;
  • Диалоговый менеджер заново принимает решение: продолжить разговор, уточнить, сменить ветку.

 

Все это в сумме делает диалог максимально живым. Также можно настроить, в каких точках перебивание допустимо (например, нельзя перебивать юридическую оговорку, но можно перебить уточнение).

Перебивание и «активное слушание» (угуканье, поддакивание) создают полноценную имитацию настоящего разговора, а отсутствие задержек в речи не дает понять клиенту, что он говорит с роботом. Именно поэтому Fromtech внедряет технологию Realtime-LLM: робот начинает генерировать ответ ещё до окончания фразы клиента, сокращая паузы и создавая впечатление, что вы общаетесь с реальным человеком.

Почему использование голосовых роботов приносит выгоду бизнесу?

Голосовые роботы на базе ИИ перестают быть просто технологической инновацией, а становятся эффективным инструментом, который приносит компаниям реальную финансовую выгоду. Вот 5 ключевых причин, почему их внедрение может окупиться:

  1. Снижение операционных затрат
    В рамках пилотных проектов один робот заменяет 10–15 операторов, экономя на зарплатах, обучении и онбординге сотрудников, а автоматизация рутинных звонков (напоминания, подтверждения, опросы) сокращает нагрузку на колл-центры.
  2. Повышение конверсии
    В тестовых диалогах ИИ анализирует тон голоса и адаптирует сценарий: например, при агрессии переключает на оператора, при сомнениях — предлагает скидку. Кроме того, робот умеет использовать данные из CRM и баз данных.
  3. Круглосуточная работа без перерывов
    В тестовой среде Fromtech роботы звонят в «счастливые часы» клиента (определяют лучшее время по анализу поведения).
  4. Масштабирование без потери качества
    Один робот может совершать до 5000 звонков в день (человек — 50–100). Для бизнеса с сезонностью (например, туризм или ритейл) это позволяет быстро наращивать обзвон без найма временных сотрудников.
  5. Юридическая защита и аналитика
    Автоматическое соблюдение закона (например, ФЗ-230 в РФ): робот не позвонит в запрещенное время или на номер из «стоп-листа». Детальная аналитика же подскажет какие фразы работают, на каких клиентах «срывается» диалог и как улучшить уже имеющиеся скрипты.

На данный момент Fromtech уже протестировал 3 архитектуры GenAI — с LLM как частью скрипта, с RAG по доменной базе знаний, и с realtime-сценариями.

 

GenAI — перспективное направление, над которым команда Fromtech активно работает прямо сейчас. Скриптовые же роботы — уже зрелое решение для автоматизации со множеством кейсов и примерами внедрения. Fromtech помогает бизнесу выбрать оптимальную стратегию — от простых сценариев до экспериментов с искусственным интеллектом.

Читайте подробнее…