@cawadead

Как распределить документы среди людей по ключевым словам?

Имеется набор людей, за каждым из которых закреплен набор каких-то ключевых слов. Также имеется набор документов, в каждом из которых есть набор ключевых слов. Мне необходимо распределить эти документы среди людей по ключевым словам. Из возможных вариантов у меня появился только распределение путем кластеризации, задав количество кластеров равное количеству людей и потом предсказывая, к какому кластеру будет относиться документ. На сколько это правильно? Возможно стоит как-то по другому сделать?
  • Вопрос задан
  • 62 просмотра
Пригласить эксперта
Ответы на вопрос 1
wataru
@wataru Куратор тега Математика
Разработчик на С++, экс-олимпиадник.
Определите какую-то метрику. Или количество общих слов у человека и документа или как-то оно нормализованное, вроде какая часть их слов у них общая. После построения матрицы растояния уже можно решать вашу задачу.

Если документы можно распределять ненормированно, то просто давайте каждый документ ближайшему человеку.

Если надо как-то нормировать нагрузку, то тут возникает задача назначения, которая может решаться алгоритмом максимального потока минимальной стоимости. Можно вводить штрафы на перегрузку каждого человека и тогда алгоритм может выдавать документы не ближайшим людям, у которых мало работы.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы