$dialer.getTtsConfig
Метод возвращает настройки провайдера TTS телефонного канала, через который проходит текущий звонок.
Синтаксис
Метод вызывается без аргументов:
$dialer.getTtsConfig();
Метод возвращает объект с настройками.
Поля этого объекта отличаются в зависимости от провайдера.
Если у провайдера нет дополнительных настроек, метод возвращает пустой объект {}
.
$dialer.setTtsConfig
.Настройки провайдеров
Google
-
lang
- Язык, на котором синтезируется речь.
-
voice
- Голос для синтеза.
подсказкаПолный список языков и голосов для синтеза в документации Google. -
- Высота голоса.
Принимает целое или дробное значение от
-20
до20
, где-20
— уменьшение на 20 полутонов от исходного тона, а20
— увеличение.
- Высота голоса.
Принимает целое или дробное значение от
-
- Скорость синтезированной речи.
Принимает целое или дробное значение от
0.25
до4
, где1
— нормальная скорость голоса.
- Скорость синтезированной речи.
Принимает целое или дробное значение от
-
- Увеличение громкости в дБ от нормальной громкости голоса.
Принимает целое или дробное значение от
-96
до16
. При значении6
громкость примерно в два раза превышает нормальную.
- Увеличение громкости в дБ от нормальной громкости голоса.
Принимает целое или дробное значение от
Яндекс
Список доступных настроек зависит от версии TTS.
Вы можете получить текущую версию во время звонка с помощью $dialer.getTtsConfig
.
Если параметр useV3
имеет значение true
, то используется третья версия протокола Yandex SpeechKit.
Выберите версию в настройках подключения.
Не изменяйте значение параметра useV3
с помощью $dialer.setTtsConfig
, так как это может привести к ошибкам TTS.
- v1
- v3
lang
- Язык, на котором синтезируется речь.
voice
- Голос для синтеза.
speed
- Скорость синтезированной речи.
Принимает целое или дробное значение от
0.1
до3
, где1
— нормальная скорость голоса.
- Скорость синтезированной речи.
Принимает целое или дробное значение от
emotion
-
Амплуа — характеристика звучания голоса. Например, диктор может говорить более дружелюбно или шепотом.
предупреждениеЕсли вы используете амплуа, которое не поддерживается для текущего голоса, то произойдет ошибка TTS.
-
-
lang
- Язык, на котором синтезируется речь.
-
voice
- Голос для синтеза.
-
speed
- Скорость синтезированной речи.
Принимает целое или дробное значение от
0.1
до3
, где1
— нормальная скорость голоса.
- Скорость синтезированной речи.
Принимает целое или дробное значение от
-
volume
- Громкость синтезированной речи относительно цифровой полной шкалы LUFS.
Принимает целое или дробное значение от
-145
до0
. Рекомендуемый диапазон значений — от−20
до−16
LUFS.
- Громкость синтезированной речи относительно цифровой полной шкалы LUFS.
Принимает целое или дробное значение от
-
role
-
Амплуа — характеристика звучания голоса. Например, диктор может говорить более дружелюбно или шепотом.
предупреждениеЕсли вы используете амплуа, которое не поддерживается для текущего голоса, то произойдет ошибка TTS.
-
-
useVariables
- Если параметр включен, для синтеза используется технология Yandex SpeechKit Brand Voice Adaptive с поддержкой переменных.
Полный список языков, голосов и их амплуа смотрите в документации Яндекса.
Azure
-
language
- Язык, на котором синтезируется речь.
-
voiceName
- Голос для синтеза.
подсказкаПолный список языков и голосов для синтеза в документации Azure. -
sampleRate
- Частота дискретизации.
Aimyvoice
voice
- Голос для синтеза.
Сбер
-
voice
- Голос для синтеза.
подсказкаПолный список голосов для синтеза в документации Сбера
3iTech
model
- Языковая модель для синтеза речи.
sampleRate
- Частота дискретизации.
speed
- Скорость синтезированной речи.
tone
- Тон голоса.
Audiogram
voice
- Голос для синтеза речи.
modelType
- Модель для синтеза речи.
voiceStyle
- Эмоциональная окраска голоса.
Возможные значения для настроек TTS Audiogram смотрите в статье Создание подключения.
ElevenLabs
-
voiceId
-
Идентификатор голоса. Вы можете скопировать его в интерфейсе ElevenLabs.
примечаниеСайт ElevenLabs недоступен для российских IP-адресов.
-
-
modelId
- Модель для синтеза речи.
-
stability
- Определяет стабильность голоса и вариативность синтеза. При низких значениях голос звучит эмоционально, при высоких — монотонно. Принимает значения от
0
до1
.
- Определяет стабильность голоса и вариативность синтеза. При низких значениях голос звучит эмоционально, при высоких — монотонно. Принимает значения от
-
similarityBoost
- Определяет, насколько точно ИИ должен имитировать оригинальный голос. Принимает значения от
0
до1
.
- Определяет, насколько точно ИИ должен имитировать оригинальный голос. Принимает значения от
-
style
- Усиливает стиль оригинального голоса. Принимает значения от
0
до1
. Значения выше0
требуют больше ресурсов и могут увеличить задержку.
- Усиливает стиль оригинального голоса. Принимает значения от