Как Кинопоиск определяет ключевые слова для фильма?

5aecb7e092e4f372404502.png

Интересно, это делает контент-менеджер, который смотрит фильм, а потом описывает ключевики, или это делается как-то машинным образом?
  • Вопрос задан
  • 1048 просмотров
Пригласить эксперта
Ответы на вопрос 5
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com
Похоже, это всё из описания содержания фильма с подбором по определённым правилам:
1. полное описательное действие,
2. описательный тип персонажа,
3. все эмоциональные характеристики или действия
4. имена собственные, названия мест и т.д.
5. все словосочетания объектов/действий, содержащие любую словоформу: "женщина, мужчина, название, мотив, злодей, герой, актёр, происхождение" (и т.д.).

Словоформы (п.5) - это скорее всего, ОБЩАЯ таблица существительных на основе описаний ВСЕХ фильмов, встречающихся наиболее часто в описаниях всех этих фильмов вместе взятых. (т.е. автоматически сформированное тегирование)
Также, думаю, что сделано добавление в ручном режиме любых исходных словоформ для максимального построения необходимых интересных для читателя тематических групп (тегов/нод).
Ответ написан
dw9694
@dw9694
Моё хобби Python
5aed34918ad81132406089.png
Вот скрин с imdb.
Ну а дальше, скрипт который пропускает слова через свою призму. Вуаля!
Ответ написан
OtshelnikFm
@OtshelnikFm
Обо мне расскажет yawncato.com
Кинопоиск сам ничего не делает. Он очень давно паразитирует с IMDB. Их ноухау состоит в том, что они однажды написали парсер с imdb и тупо прогоняют его потом через перевод. Описание правит редактор, а вот актеров и всю съемочную команду, слова, жанры, страны - он прогонят сопоставляя слово-перевод.

Потом они еще предложили простым юзерам это делать через форму "добавить" - туда юзер может прислать и ключевое слово и обложки и кадры - но они запарились с этим - некоторые материалы месяцами не добавляют. Т.к. денег на развитие КП у них нету - людей нанять - жаба душит, ну и с кинотеатром у них затея провалилась. Так что купили однажды написанный на коленке сайт - теперь не знают что с ним делать. Редизайн им аудитория запрещает менять - теперь вот они его душат потихоньку.
Ответ написан
Комментировать
@asd111
это делает человек.
Ответ написан
Комментировать
deksden
@deksden
Enterpreneur
Интересно, когда кто-то напишет нейронку для автоматической генерации тэгов по описанию и рецензиям?
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы