Yandex.Cloud запустил сервис для создания фирменных голосов компаний

0 0

Платформа Yandex.Cloud запустила сервис для создания фирменных голосов Yandex SpeechKit Brand Voice. Теперь компании смогут создать собственный голос для сложных диалоговых сценариев с клиентами, а также для автоматизации работы колл-центров, проведения опросов, телемаркетинга и контроля.

Yandex.Cloud запустил сервис для создания фирменных голосов компаний

Yandex SpeechKit Brand Voice разработан на базе речевых ML-моделей, которые обучаются с использованием записей голоса реального человека, сообщили RB.ru в пресс-службе компании. В итоге с помощью искусственного интеллекта создается практически полная цифровая копия голоса.

Yandex SpeechKit Brand Voice представлен в двух версиях: Adaptive и Full. Первая версия Adaptive — это доступное и быстрое решение преимущественно для исходящих звонков. Версия Full нацелена на создание умных голосовых помощников, таких как «Алиса», способных помогать клиентам с любыми вопросами.

SpeechKit Brand Voice Adaptive

В основе версии Brand Voice Adaptive лежит синтез переменных — не имеющая аналогов в мире разработка Yandex.Cloud. Она может синтезировать цифровую копию голоса конкретного человека по заданным заранее шаблонам за несколько часов, а затем персонализировать речь: добавлять нужное обращение, данные конкретного заказа, сумму и так далее. При этом синтезированный голос звучит так же естественно, как если бы фразу произносил реальный человек.

Уникальный голос в Brand Voice Adaptive создается за 1 месяц и стоит 150 тысяч рублей в месяц. Технология лучше всего показывает себя там, где заранее определены сценарии:прием входящих звонков на первой линии или исходящие звонки клиентам. 

SpeechKit Brand Voice Full

Версия Brand Voice Full — это полная цифровая копия голоса реального человека без ограничений. С помощью Brand Voice Full можно создать полноценного голосового ассистента, который сможет отвечать на любые вопросы клиентов компании. Она обучается на базе 50 часов записей реального человека, а после способна воспроизводить его голосом любой текст.

Время внедрения голоса составляет примерно 6 месяцев, а стоимость разработки модели определяется индивидуально, в зависимости от сложности задач клиента. 

Подписывайтесь на наш TG-канал, чтобы быть в курсе всех новостей и событий!

Фото: Unsplash

Источник: rb.ru
Оставить комментарий

Мы используем файлы cookie. Продолжив использование сайта, вы соглашаетесь с Политикой использования файлов cookie и Политикой конфиденциальности Принимаю

Privacy & Cookies Policy