Skip to end of metadata
Go to start of metadata

You are viewing an old version of this page. View the current version.

Compare with Current View Page History

Version 1 Next »

Для каждого вопроса пользователя система ищет в базах знаний наиболее релевантные документы. На основе результатов поиска складывается автоматический ответ пользователю или набор рекомендаций оператору.

В этой статье описано как система может оценивать подобие вопроса пользователя и примеров вопросов в документах, как управлять механизмом поиска и какие лучше вносить примеры для более качественной работы баз знаний.

Настройки базы знаний

Основные настройи баз знаний можно найти в меню.

На поиск по базе знаний влияют следующие настройки базы знаний:

  • Язык документов

  • Поиск по базе знаний

Настройка “Язык документов” указывает на то на каком языке в документах хранятся примеры вопросов и на каком языке ожидаются вопросы пользователя. Вопрос пользователя поступишвий на другом языке получит плохие результаты поиска. Подробнее о языке базы знаний смотрите в разделе Язык базы знаний.

Настройка “Поиск в базе знаний” указывает на один из вариантов поиска:

  • по полному тексту вопроса - система оценивает полное подобие реплик

  • по части текста вопроса - система оценивает частичное подобие реплик

Так же, в зависимости от числа документов и примеров формулировок вопросов в них все базы знаний делятся на 2 группы:

  • базы знаний с малым числом примеров

  • базы знаний с большим числом примеров

В базах знаний с малым числом примеров систама попарно сравнивает вопрос пользователя с каждым примером вопроса в документах. Процедура сравнения зависит от настройки “Поиск по базе знаний” - каждый вариант детально описан ниже.

В базах знаний с большим числом примеров входящий вопрос пользователя оценивается сразу во всем накопленным массивом примеров. Управление такими базами знаний описано отдельно.

Описание ниже схематично, но дает принципиальное понимание работы механизма поиска.

Оценка полного подобия

Система сравнивает вопрос пользователя с примером вопроса полностью.

Каждому слову в вопросе пользователя система ищет соотвествие в примере вопроса - аналогичное слово или синоним. Для каждой пары слов система выставляет степень близости и в итоге рассчитывает общую близость реплик.

Если вопрос пользователя содержит больше слов, то общая точность поиска понижается, так как система не может найти подобие в примере вопроса. Если вопрос пользователя содержит меньше слов, то итоговая оценка так же понижается.

Оценка полного подобия хорошо подходит в случаях, когда:

  • у вас высокие требования к качеству поиска, все сомнительные вопросы вы хотите отправлять на операторов

  • в базе знаний много документов и разница в вопросах к ним выражается 1-2 словами

Оценка частичного подобия

Система ищет вхождения примера вопроса в реплику пользователя.

Каждому слову в примере вопроса система ищет пару в вопросе пользователя - аналогичное слово или синоним. Слова в вопросе пользователя, которым не нашлась пара, просто игнорируются.

Если вопрос пользователя содержит меньше слов чем пример вопроса, то общая точность поиска понижается.

Этот механизм идеально подходит в случаях когда:

  • ваши пользователи могут задать вопрос разного объема, но в вопросе важно уловить намерение

  • у вас пока нет возможности накопить все варианты вопросов пользователя

Классификация на большом числе примеров

  • No labels