Настройка проекта
Чтобы настроить NLU для проекта:
-
Нажмите в карточке проекта → Настройки проекта.
-
Заполните поля на вкладке Классификатор:
-
Алгоритм классификатора — выберите алгоритм классификатора:
-
STS (Semantic Textual Similarity) — алгоритм, который сравнивает семантическую близость слов. Он учитывает инверсию, словарные формы слов, их синонимы и другую информацию. Рекомендуется использовать при обучении бота на незначительном наборе данных: 5–7 тренировочных фраз на интент, но не более 1 000 фраз во всей выборке.
-
Classic ML — стандартный алгоритм машинного обучения для распознавания интентов на основе логистической регрессии. Он классифицирует данные по исходным словам, словарным формам и основам слов без учета семантической информации. Рекомендуется использовать при выборке объемом не менее 20 тренировочных фраз на интент.
-
Deep Learning — алгоритм на основе сверточных нейронных сетей. Учитывает семантику слов при формировании гипотез. Рекомендуется использовать при значительном наборе данных: не менее 50 тренировочных фраз на интент.
-
Transformer — мультиязычный алгоритм. Он оценивает семантическое сходство запроса клиента со всеми тренировочными фразами из интента. Рекомендуется использовать при выборке объемом не менее 10 тренировочных фраз на интент.
к сведениюСервис классификации Transformer развернут на платформе Caila. Если в своем проекте вы выбрали этот тип классификатора, то при помощи расширенных настроек вы можете использовать вместо стандартного сервиса любой другой классификатор из Caila. Ознакомьтесь с примерами такой интеграции в статье Подключение сервисов Caila в JAICP.
-
-
Исправление орфографии — переведите переключатель в активное положение, чтобы исправлять орфографические ошибки в запросах клиентов.
-
Поиск совпадений — переведите переключатели в активное положение, чтобы искать совпадения:
- Во фразах интентов и вопросах базы знаний Q&A.
- В ответах интентов и базы знаний Q&A.
-
Часовой пояс — укажите часовой пояс по умолчанию. Если в запросе клиента не было информации о часовом поясе, будет использована информация из настроек проекта — это может быть важно при работе с сущностями для распознавания времени.
-
На вкладке Настройки NLU вы можете задать параметры в виде JSON-объекта, чтобы настроить NLU, а также подключить внешний NLU-сервис к вашему проекту.
API-ключ NLP Direct API
API-ключ NLP Direct API позволяет использовать обученный классификатор в сторонних приложениях.
Перейдите в Настройки проекта → Классификатор → сохраните API-ключ NLP Direct API.
Импорт данных и настроек NLU
Чтобы импортировать данные и настройки:
- Перейдите в Настройки проекта → Классификатор.
- Прикрепите или перетащите файл в поле Импорт данных и настроек NLU.