Воспроизведение аудио

В телефонном канале и в голосовых ассистентах в качестве ответов бота можно использовать не только синтезированные реплики, но и предзаписанные аудиофайлы. Основное преимущество аудио в том, что речь диктора более живая и динамичная. Это позволяет более качественно выстраивать диалог с клиентами.

подсказка

Если вам нужно, чтобы бот озвучивал в диалоге переменные значения, зависящие от контекста, вы можете воспользоваться синтезом речи с переменными.

Формат аудиофайлов

Для телефонного канала
Для голосовых ассистентов

Расширение файла .wav.
- Постоянный битрейт 128 кбит/c.
- 1 канал (моно).
- Частота дискретизации 8 кГц.
- Кодирование 16-bit (PCM) little-endian.
Размер файла не более 10 Мбайт.

Расширение файла .mp3.
Продолжительность не более 4 минут.
Размер файла не более 10 Мбайт.

Использование в сценарии

Есть несколько способов воспроизвести аудио из сценария:

Через DSL-тег audio.
Через метод $reactions.audio.
Через ответ с типом audio в массиве $response.replies.

Во всех случаях нужно указать прямую ссылку на аудиофайл. Файл может быть размещен в любом хранилище, где до него есть публичный доступ.

state: Playback
    audio: https://example.com/audio.wav

Кэширование аудио

При первом воспроизведении аудиофайлы кэшируются на сервере, где размещен бот. Это позволяет при повторном воспроизведении проигрывать их без дополнительных задержек.

предупреждение

Ключом в кэше выступают ссылки на аудиофайлы. Это означает, что если изменить содержимое исходного аудиофайла, например обрезать или заменить текст на другой, но название оставить прежним, изменения не отразятся в боте. Будет по-прежнему использоваться изначальная версия аудио из кэша.

подсказка

При внесении изменений в воспроизводимые аудиофайлы не забывайте их переименовывать.

Формат аудиофайлов​

Использование в сценарии​

Кэширование аудио​

Формат аудиофайлов

Использование в сценарии

Кэширование аудио