Что лучше для старта рекомендательной системы, холодный старт или датасет сдвинутый в сторону высшей оценки?
Здравствуйте, я использую алгоритм SVD и для старта работы есть выбор:
1) В самом началеъ отключить РС и собирать оценки пользователей
2) Включить РС и собирая оценки пользователей пересчитывать матрицы
3) Либо у меня есть датасет, однако там оценки только 4 и 5 по пятибальной системе - негативных оценок нет..
Вначале - нужно провести однократно полный цикл Full-Mesh бинарного сравнения и, таким образом, настроить стартовые веса для каждой позиции.
По-скольку, уже что-то у Вас есть: оценки 4 и 5: используйте половинное деление (по нижней границе относительно всех показателей: у Вас - это 4-ка) для создания бинарных отзывов: 4=>плохо/нет (-1) и 5=>хорошо/да (1).
Затем - итерационно корректировать по мере изменения значений у конкретных показателей.
Но ведь 4 это не плохо, 4 это пользователю понравилось на 80% или это не играет роли для настройки весов? Я читал что при бинарное сравнение приводит к проблеме, которая именуется как implicit feedback problem, стоит ли в моём случае это принимать во внимание?
ILoveYAnny: либо вы их настраиваете так, либо делаете веса с нуля через попарное Full-Mesh сравнение. Как вообще организуется кластер?
Создаётся осевая разделяющая: abs(min-max)/2 + alignment = 0,
abs(4-5)/2 + alignment=0
0.5 + alignment = 0
alignment= -0.5
И уже относительно неё - расставляются веса, производятся "срезы" и находятся периоды.