$dialer.getTtsConfig
Метод возвращает настройки провайдера TTS телефонного канала, через который проходит текущий звонок.
Синтаксис
Метод вызывается без аргументов:
$dialer.getTtsConfig();
Метод возвращает объект с настройками.
Поля этого объекта отличаются в зависимости от провайдера.
Если у провайдера нет дополнительных настроек, метод возвращает пустой объект {}.
$dialer.setTtsConfig.Настройки провайдеров
Google
-
lang- Язык, на котором синтезируется речь.
-
voice- Голос для синтеза.
подсказкаПолный список языков и голосов для синтеза в документации Google. -
- Высота голоса.
Принимает целое или дробное значение от
-20до20, где-20— уменьшение на 20 полутонов от исходного тона, а20— увеличение.
- Высота голоса.
Принимает целое или дробное значение от
-
- Скорость синтезированной речи.
Принимает целое или дробное значение от
0.25до4, где1— нормальная скорость голоса.
- Скорость синтезированной речи.
Принимает целое или дробное значение от
-
- Увеличение громкости в дБ от нормальной громкости голоса.
Принимает целое или дробное значение от
-96до16. При значении6громкость примерно в два раза превышает нормальную.
- Увеличение громкости в дБ от нормальной громкости голоса.
Принимает целое или дробное значение от
Яндекс
Список доступных настроек зависит от версии TTS.
Вы можете получить текущую версию во время звонка с помощью $dialer.getTtsConfig.
Если параметр useV3 имеет значение true, то используется третья версия протокола Yandex SpeechKit.
Выберите версию в настройках подключения.
Не изменяйте значение параметра useV3 с помощью $dialer.setTtsConfig, так как это может привести к ошибкам TTS.
- v1
- v3
lang- Язык, на котором синтезируется речь.
voice- Голос для синтеза.
speed- Скорость синтезированной речи.
Принимает целое или дробное значение от
0.1до3, где1— нормальная скорость голоса.
- Скорость синтезированной речи.
Принимает целое или дробное значение от
emotion-
Амплуа — характеристика звучания голоса. Например, диктор может говорить более дружелюбно или шепотом.
предупреждениеЕсли вы используете амплуа, которое не поддерживается для текущего голоса, то произойдет ошибка TTS.
-
-
lang- Язык, на котором синтезируется речь.
-
voice- Голос для синтеза.
-
speed- Скорость синтезированной речи.
Принимает целое или дробное значение от
0.1до3, где1— нормальная скорость голоса.
- Скорость синтезированной речи.
Принимает целое или дробное значение от
-
volume- Громкость синтезированной речи относительно цифровой полной шкалы LUFS.
Принимает целое или дробное значение от
-145до0. Рекомендуемый диапазон значений — от−20до−16LUFS.
- Громкость синтезированной речи относительно цифровой полной шкалы LUFS.
Принимает целое или дробное значение от
-
role-
Амплуа — характеристика звучания голоса. Например, диктор может говорить более дружелюбно или шепотом.
предупреждениеЕсли вы используете амплуа, которое не поддерживается для текущего голоса, то произойдет ошибка TTS.
-
-
useVariables- Если параметр включен, для синтеза используется технология Yandex SpeechKit Brand Voice Adaptive с поддержкой переменных.
Полный список языков, голосов и их амплуа смотрите в документации Яндекса.
Azure
-
language- Язык, на котором синтезируется речь.
-
voiceName- Голос для синтеза.
подсказкаПолный список языков и голосов для синтеза в документации Azure. -
sampleRate- Частота дискретизации.
Aimyvoice
voice- Голос для синтеза.
Сбер
-
voice- Голос для синтеза.
подсказкаПолный список голосов для синтеза в документации Сбера
3iTech
model- Языковая модель для синтеза речи.
sampleRate- Частота дискретизации.
speed- Скорость синтезированной речи.
tone- Тон голоса.
Audiogram
voice- Голос для синтеза речи.
modelType- Модель для синтеза речи.
voiceStyle- Эмоциональная окраска голоса.
Возможные значения для настроек TTS Audiogram смотрите в статье Создание подключения.
ElevenLabs
-
voiceId-
Идентификатор голоса. Вы можете скопировать его в интерфейсе ElevenLabs.
примечаниеСайт ElevenLabs недоступен для российских IP-адресов.
-
-
modelId- Модель для синтеза речи.
-
stability- Определяет стабильность голоса и вариативность синтеза. При низких значениях голос звучит эмоционально, при высоких — монотонно. Принимает значения от
0до1.
- Определяет стабильность голоса и вариативность синтеза. При низких значениях голос звучит эмоционально, при высоких — монотонно. Принимает значения от
-
similarityBoost- Определяет, насколько точно ИИ должен имитировать оригинальный голос. Принимает значения от
0до1.
- Определяет, насколько точно ИИ должен имитировать оригинальный голос. Принимает значения от
-
style- Подчеркивает уникальные черты голоса и делает голос более выразительным. Принимает значения от
0до1. Значения выше0требуют больше ресурсов и могут увеличить задержку.
- Подчеркивает уникальные черты голоса и делает голос более выразительным. Принимает значения от
-
speed- Управляет скоростью речи. Принимает значения от
0.7до1.2. Чем выше значение, тем быстрее будет речь. Значение по умолчанию —1.0.
- Управляет скоростью речи. Принимает значения от