Machine learning для определение веса пользователя?

Есть куча данных активности пользователя, которые не расшифрованы и не подписаны - Параметры V1-V-30
Есть обучающая выборка и тестовая и нужно определить вероятность веса пользователя больше 90 кг.
Метрики не подписаны. Какой алгоритм решения подобной задачи ?
  • Вопрос задан
  • 415 просмотров
Пригласить эксперта
Ответы на вопрос 3
@Roman_Kh
Ответ написан
Комментировать
@borodaturan
Python developer
Любой. Исходя из такого объяснения не возможно ответить на вопрос. В настоящее время любят использовать градиентный бустинг на деревьях решений. При прочих равных это метод часто дает лучший результат.
Для начала лучше попытаться разобраться в самих данных. Может получится часть из них убрать за ненадобностью или сформировать на их основе более информативные признаки.
Ответ написан
Комментировать
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com
E - знак суммы
V - параметр
N - № показателя параметра (от 1..30)
A - индекс из всех искомых цепочек параметров (например, ID пользователя или сессии)
Vm (middle) - средние значения обучения и/или заведомо проверенных данных (эталонных)
Vd - дельта отклонения от эталона.
W - вес (чем меньше, тем лучше)
-----------------
Vm[N]=E(V[N])/N //Средний вес каждого значения из эталонных: средний эталон
Vd[A][N]=abs(Vm[N]-V[A][N]) //Расстояние от эталонного (по каждому из искомых)
W[A]=E(Vd[A][N]) //Суммарная удалённость (по каждому каждого из искомых) от эталона
W=min(W[A]) //Минимальная удалённость из всех (он же - максимальный вес, близкий к эталону)
A - искомый пользователь с максимальной вероятностью к искомым параметрам
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы