$dialer.getTtsConfig

Метод возвращает настройки провайдера TTS телефонного канала, через который проходит текущий звонок.

Синтаксис

Метод вызывается без аргументов:

$dialer.getTtsConfig();

Метод возвращает объект с настройками. Поля этого объекта отличаются в зависимости от провайдера. Если у провайдера нет дополнительных настроек, метод возвращает пустой объект {}.

подсказка

Все настройки, которые возвращает метод, можно переопределить для текущего звонка при помощи метода $dialer.setTtsConfig.

Настройки провайдеров

Google

lang
- Язык, на котором синтезируется речь.
voice
- Голос для синтеза.
подсказка
Полный список языков и голосов для синтеза в документации Google.
pitch
- Высота голоса. Принимает целое или дробное значение от -20 до 20, где -20 — уменьшение на 20 полутонов от исходного тона, а 20 — увеличение.
speakingRate
- Скорость синтезированной речи. Принимает целое или дробное значение от 0.25 до 4, где 1 — нормальная скорость голоса.
volumeGain
- Увеличение громкости в дБ от нормальной громкости голоса. Принимает целое или дробное значение от -96 до 16. При значении 6 громкость примерно в два раза превышает нормальную.

Яндекс

Список доступных настроек зависит от версии TTS.

Вы можете получить текущую версию во время звонка с помощью $dialer.getTtsConfig. Если параметр useV3 имеет значение true, то используется третья версия протокола Yandex SpeechKit.

предупреждение

Выберите версию в настройках подключения.

Не изменяйте значение параметра useV3 с помощью $dialer.setTtsConfig, так как это может привести к ошибкам TTS.

lang
- Язык, на котором синтезируется речь.
voice
- Голос для синтеза.
speed
- Скорость синтезированной речи. Принимает целое или дробное значение от 0.1 до 3, где 1 — нормальная скорость голоса.
emotion
- Амплуа — характеристика звучания голоса. Например, диктор может говорить более дружелюбно или шепотом.
  
  предупреждение
  Если вы используете амплуа, которое не поддерживается для текущего голоса, то произойдет ошибка TTS.

lang
- Язык, на котором синтезируется речь.
voice
- Голос для синтеза.
speed
- Скорость синтезированной речи. Принимает целое или дробное значение от 0.1 до 3, где 1 — нормальная скорость голоса.
volume
- Громкость синтезированной речи относительно цифровой полной шкалы LUFS. Принимает целое или дробное значение от -145 до 0. Рекомендуемый диапазон значений — от −20 до −16 LUFS.
role
- Амплуа — характеристика звучания голоса. Например, диктор может говорить более дружелюбно или шепотом.
  
  предупреждение
  Если вы используете амплуа, которое не поддерживается для текущего голоса, то произойдет ошибка TTS.
useVariables
- Если параметр включен, для синтеза используется технология Yandex SpeechKit Brand Voice Adaptive с поддержкой переменных.

подсказка

Полный список языков, голосов и их амплуа смотрите в документации Яндекса.

Azure

language
- Язык, на котором синтезируется речь.
voiceName
- Голос для синтеза.
подсказка
Полный список языков и голосов для синтеза в документации Azure.
sampleRate
- Частота дискретизации.

Aimyvoice

voice
- Голос для синтеза.

Сбер

voice
- Голос для синтеза.
подсказка
Полный список голосов для синтеза в документации Сбера

3iTech

model
- Языковая модель для синтеза речи.
sampleRate
- Частота дискретизации.
speed
- Скорость синтезированной речи.
tone
- Тон голоса.

Audiogram

voice
- Голос для синтеза речи.
modelType
- Модель для синтеза речи.
voiceStyle
- Эмоциональная окраска голоса.

подсказка

Возможные значения для настроек TTS Audiogram смотрите в статье Создание подключения.

ElevenLabs

voiceId
- Идентификатор голоса. Вы можете скопировать его в интерфейсе ElevenLabs.
  
  примечание
  Сайт ElevenLabs недоступен для российских IP-адресов.
modelId
- Модель для синтеза речи.
stability
- Определяет стабильность голоса и вариативность синтеза. При низких значениях голос звучит эмоционально, при высоких — монотонно. Принимает значения от 0 до 1.
similarityBoost
- Определяет, насколько точно ИИ должен имитировать оригинальный голос. Принимает значения от 0 до 1.
style
- Подчеркивает уникальные черты голоса и делает голос более выразительным. Принимает значения от 0 до 1. Значения выше 0 требуют больше ресурсов и могут увеличить задержку.
speed
- Управляет скоростью речи. Принимает значения от 0.7 до 1.2. Чем выше значение, тем быстрее будет речь. Значение по умолчанию — 1.0.

Синтаксис​

Настройки провайдеров​

Google​

Яндекс​

Azure​

Aimyvoice​

Сбер​

3iTech​

Audiogram​

ElevenLabs​

Синтаксис

Настройки провайдеров

Google

Яндекс

Azure

Aimyvoice

Сбер

3iTech

Audiogram

ElevenLabs