Результаты распознавания речи
Результаты распознавания речи добавляются в $request.rawRequest. Данные доступны в поле $request.rawRequest.data.
Пример:
{
"cause": "OK",
"text": "Как дела?"
}
Здесь:
cause— результат распознавания. Возможные значения:"OK"— речь была успешно распознана."NO_INPUT"— не удалось распознать речь.
text— текст речи пользователя. Поле присутствует, еслиcauseимеет значение"OK".
Данные о запросе пользователя
Результаты также могут содержать дополнительные данные о запросе пользователя, полученные от провайдера ASR. Данные доступны для следующих провайдеров:
- 3iTech
- Audiogram
- SaluteSpeech
- T-Bank VoiceKit
- Yandex SpeechKit v2
- Yandex SpeechKit v3
Например, вы можете получить:
- Гипотезы о поле пользователя в T-Bank VoiceKit.
- Показатель вероятности, что вместо пользователя говорит автоответчик, в Yandex SpeechKit v3.
- Эмоции пользователя в SaluteSpeech.
Данные доступны в поле $request.rawRequest.data.propertiesResponse.
Пример:
{
"result": {
"recognition_result": {
"start_time": "0.510s",
"end_time": "2.550s",
"gender_identification_result": {
"male_proba": 0.991876,
"female_proba": 0.008123994
}
},
"is_final": true
}
}
Поддерживаемые поля
Поддерживается ограниченный список полей:
- 3iTech
- Audiogram
- SaluteSpeech
- T-Bank VoiceKit
- Yandex SpeechKit v2
- Yandex SpeechKit v3
В $request.rawRequest.data.propertiesResponse.results доступны поля:
-
session_id -
text -
final -
quality_score -
answerphone_detected -
sentiments_info:-
phrase_sentiments:sentiment_probsphrase_id
-
avg_sentiments_probs
-
-
words_per_second -
age_group -
tech_metrics:data_received_ms
В документации 3iTech вы можете посмотреть описание этих полей и узнать об условиях, при которых они добавляются.
В $request.rawRequest.data.propertiesResponse доступны поля:
-
hypothesis:transcriptnormalized_transcriptconfidence
-
genderage:-
gender -
age -
emotion:positiveneutralnegative_angrynegative_sad
-
-
spoofing_result
В документации Audiogram в разделе «RecognizeResponse» вы можете посмотреть описание этих полей и узнать об условиях, при которых они добавляются.
В $request.rawRequest.data.propertiesResponse.results доступны поля:
-
eou -
results -
emotions_result:Emotions.positiveEmotions.negativeEmotions.neutral
-
backend_info -
processed_audio_start -
processed_audio_end -
SpeakerInfo
В документации SaluteSpeech вы можете посмотреть описание этих полей и узнать об условиях, при которых они добавляются.
В $request.rawRequest.data.propertiesResponse.results доступны поля:
-
recognition_result:-
channel -
start_time -
end_time -
sentiment_analysis_result:negative_prob_audionegative_prob_audio_text
-
gender_identification_result:male_probafemale_proba
-
is_final
-
В документации T-Bank VoiceKit вы можете посмотреть описание этих полей и узнать об условиях, при которых они добавляются.
В $request.rawRequest.data.propertiesResponse.results доступны поля:
chunks:-
alternatives:textconfidence
-
final -
endOfUtterance
-
В документации Yandex SpeechKit v2 вы можете посмотреть описание этих полей и узнать об условиях, при которых они добавляются.
В $request.rawRequest.data.propertiesResponse.results доступны поля:
-
alternatives:-
words -
text -
start_time_ms -
end_time_ms -
confidence -
languages:language_codeprobability
-
-
channel_tag
В $request.rawRequest.data.propertiesResponse.classifier_updates доступны результаты классификаторов.
Данные добавляются только для событий с типом final:
-
window_type -
start_time_ms -
end_time_ms -
classifier_result:-
classifier -
highlights:textstart_time_msend_time_ms
-
labels:labelconfidence
-
В документации Yandex SpeechKit v3 вы можете посмотреть описание этих полей и узнать об условиях, при которых они добавляются.
- Некоторые данные добавляются, только если установлены дополнительные настройки для провайдера ASR. Чтобы указать настройки, используйте метод
$dialer.setAsrProperty. - Если вы хотите использовать данные, которые сейчас не поддерживаются в
$request.rawRequest, напишите в поддержку: support@just-ai.com.