Коллеги, подскажите по такому вопросу:
Имеем издание, ежедневно выпускаем 5+ статей, на момент общее количество более 1500.
Сейчас теги к статье проставляются руками, периодически устраиваем сессии анализа и по ним видно что путь не совсем верный, так как многие теги банально упускаются (+желание некоторых авторов "забить" на этот момент).
Вопрос - существуют какие-либо системы, которые бы позволили упростить данный процесс, например предлагать теги по содержанию статьи? И как вообще этим пользуются крупные поставщики медиа-контента (риа итп.)?
P.s. Используем Elastic в качестве поисковика, по видео понял что он может как-то в этой задаче помогать, но знаний не особо хватает (а точнее - их нет)
Не знаю точно как подобное реализуется на практике, но я бы сделал следующим образом:
1. Определил бы конечный набор тегов.
2. Сделал бы словарь ключевых слов к каждому из этих тегов - синонимы, слова из предметной области и т.д.
3. Анализировал бы каждую статью на наличие ключевых слов и при достаточном количестве совпадений предлагал бы добавить тег в статью.