Допустим, у меня есть большая база фильмов, в которой помимо названия указаны:
- год
- список актеров
- жанр
- режиссер
- страна
- разного рода тэги (например, "будущее", "девушка", "десант", "насекомые" - для фильма "Звездный Десант")
Так как доступа к просмотренным фильмам других людей у меня нет, то придется формировать рекомендации на основе оценки уже просмотренных
лично мной фильмов. И вот в чем вопрос. Как с теми данными, которые я имею, формировать рекомендации? Какой алгоритм вы бы посоветовали рассмотреть? И что бы в общем порекомендовали для реализации этой идеи?
Как я сам вижу алгоритм: я ставлю фильму оценку по шкале 0-10. Алгоритм добавляет определенные веса всем параметрам этого фильма. Также запоминает какие параметры встречаются чаще всего у просмотренных мной фильмов. Допустим, я посмотрел 15 фильмов ужасов и только 3 комедии. Следовательно, фильмы ужасов будут предлагаться мне чаще. Но среди 15 ужастиков низкие оценки я ставил фильмам с тегом "паранормальные явления". Следовательно, фильмы с таким тегом рекомендоваться мне не будут. Но высокие оценки я ставил фильмам с тэгом "похищение". И алгоритм будет искать для меня фильмы с тэгом "похищение" также и в других жанрах (например, триллеры). Как-то так :)