Как автоматизировать определение типа проекта?

Каждый день падают на оценку 60-80 проектов. Будет падать скоро около 200 и больше.
Есть 50 типов проектов. В будущем будет детализироваться сильнее.
Есть история ручного отбора проектов. Пока 1000 проектов с присвоенными категориями.
Можно ли как-то написать программу или скрипт, который будет рекомендовать выбирать подходящую категорию.
По ключевым словам в описании и названии проекта. Если неоднозначно - то предлагать варианты.
Если однозначно то присваивать категории. Если ошибся скрипт, то человек вручную поправит.
Как это можно сделать максимально дешевле и проще?
  • Вопрос задан
  • 260 просмотров
Пригласить эксперта
Ответы на вопрос 1
prototype_denis
@prototype_denis
Symfony
Разбиваем строку с описанием на слова, каждое прогоняем через soundex. Затем считаем слова.
К категориям привязываем индексы уже отобранных слов. И в заключении ищем категории по индексам. При добавлении (изменении) категории, добавляем (удаляем) новые индексы, если таковые имеются.
Помимо простого значения индекса в категориях, должен указан быть "вес" индексов для сортировки категорий при сопоставлении "проект - категория". (То есть, чем выше сумма "весов" всех найденных слов в категории, тем выше позиция на выходе. Это же влияет на "однозначный" выбор автоматики. Если выше определённого порога, то выбираем однозначно, иначе выбор или ручное изменение )

По сути - это реализация поисковиков до гугловских времён.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы