Защита баз знаний
Одна из проблем при заполнении базы знаний - это дублирование вопросов или ответов в документах.
Дублирование вопросов
Дублирование вопросов в разных документах может привести к непронозируемой реакции бота на вопрос пользователя. Бот будет выбирать случайный документ из тех, в которые внесены дублирующиеся формулировки вопросов.
Важно отметить, что близкими могут быть вопросы не обязательно совпадающие до единой буквы. Система оценивает близость по смысловой наполненности фразы.
Для борьбы с дублированием формулировок вопросов сервис контролирует каждое изменение набора вопросов в базах знаний:
добавление нового документа
добавление новой формулировки в существующем документе
редактирование вопроса или формулировки вопроса в существующем документе
Процесс контроля состоит в том, что система задает новую формулировку вопроса сама себе и, если ответ был найден с уверенностью выше установленного порога, система заблокирует добавление или изменение формулировки. Настройка порога производится индивидуально для каждой базы знаний при создании или в общих настройках.