Защита баз знаний


Одна из проблем при заполнении базы знаний - это дублирование вопросов или ответов в документах.

Дублирование вопросов

Дублирование вопросов в разных документах может привести к непронозируемой реакции бота на вопрос пользователя. Бот будет выбирать случайный документ из тех, в которые внесены дублирующиеся формулировки вопросов.

Важно отметить, что близкими могут быть вопросы не обязательно совпадающие до единой буквы. Система оценивает близость по смысловой наполненности фразы.

Для борьбы с дублированием формулировок вопросов сервис контролирует каждое изменение набора вопросов в базах знаний:

  • добавление нового документа

  • добавление новой формулировки в существующем документе

  • редактирование вопроса или формулировки вопроса в существующем документе

Процесс контроля состоит в том, что система задает новую формулировку вопроса сама себе и, если ответ был найден с уверенностью выше установленного порога, система заблокирует добавление или изменение формулировки. Настройка порога производится индивидуально для каждой базы знаний при создании или в общих настройках.