Воспроизведение аудио
В телефонном канале и в голосовых ассистентах в качестве ответов бота можно использовать не только синтезированные реплики, но и предзаписанные аудиофайлы. Основное преимущество аудио в том, что речь диктора более живая и динамичная. Это позволяет более качественно выстраивать диалог с клиентами.
подсказка
Если вам нужно, чтобы бот озвучивал в диалоге переменные значения, зависящие от контекста,
вы можете воспользоваться синтезом речи с переменными.
Формат аудиофайлов
- Для телефонного канала
- Для голосовых ассистентов
- Расширение файла
.wav
.- Постоянный битрейт 128 кбит/c.
- 1 канал (моно).
- Частота дискретизации 8–48 кГц.
- Кодирование 16-bit (PCM) little-endian.
- Размер файла не более 10 Мбайт.
- Расширение файла
.mp3
. - Продолжительность не более 4 минут.
- Размер файла не более 10 Мбайт.
Использование в сценарии
Есть несколько способов воспроизвести аудио из сценария:
- Через DSL-тег
audio
. - Через метод
$reactions.audio
. - Через ответ с типом
audio
в массиве$response.replies
.
Во всех случаях нужно указать прямую ссылку на аудиофайл. Файл может быть размещен в любом хранилище, где до него есть публичный доступ.
state: Playback
audio: https://example.com/audio.wav
Кэширование аудио
При первом воспроизведении аудиофайлы кэшируются на сервере, где размещен бот. Это позволяет при повторном воспроизведении проигрывать их без дополнительных задержек.
предупреждение
Ключом в кэше выступают ссылки на аудиофайлы.
Это означает, что если изменить содержимое исходного аудиофайла, например обрезать или заменить текст на другой, но название оставить прежним, изменения не отразятся в боте.
Будет по-прежнему использоваться изначальная версия аудио из кэша.
подсказка
При внесении изменений в воспроизводимые аудиофайлы не забывайте их переименовывать.