Какие существуют алгоритмы поиска оптимальной выборки/среза?

Приветствую всех!

Существует база данных на пользователей с n-ным кол-вом полей, содержащих информацию о них (пол, возраст, род занятий, и т.д.). Поля заполнены случайно для каждого пользователя или не заполнены вообще.

На каждого пользователя также имеется некая статистика (например - кол-во входов в систему в месяц).
Соответственно, по любым сочетаниям параметров можно составить среднюю статистику (например: пол+возраст, пол+возраст+семейное_положение, ...+...+*) - мужчины 30 лет входили в систему в среднем 32 раза в месяц. Таким образом формируется срез.

Какие есть алгоритмы для определения среза, наиболее четко соответствующего конкретному пользователю? То есть, зная определенные данные о нем, мы можем предположить о его статистике, смотря на среднюю по наиболее подходящему срезу.
  • Вопрос задан
  • 3120 просмотров
Решения вопроса 1
k-Nearest Neighbours (kNN)
Ваша задача в терминах этого алгоритма соответствует вопросам :
1) как настроить веса (значимость) влияния параметров на расстояние между соседями
2) какое ядро выбрать
3) как определить оптимальное k для этого ядра
На все три есть конкретные ответы в виде алгоритмов - литературы очень много.
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы