Задать вопрос
sha256
@sha256

Можно ли оценить относительную важность признаков?

Друзья, всем привет!
Прошу помочь разобраться с постановкой задачи, в чем суть:
Есть набор данных о реализации товара магазина одежды. Как можно оценить влияние критериев на принятие решения в каждом конкретном случае?
Мужчины например ориентируются на материал изделия, женщины больше на цвет. Как проранжировать эти условия?

Первое о чем подумал:
Gradient Boosting feature_importance
Но он не подходит потому-что делает оценку для всего обучающего набора. Мне же нужно относительно каждого примера.
  • Вопрос задан
  • 192 просмотра
Подписаться 2 Простой Комментировать
Решения вопроса 1
Пригласить эксперта
Ответы на вопрос 3
Therapyx
@Therapyx
Data Science
Возможно вы имеете ввиду это?
https://www.datarobot.com/wiki/feature-impact/
https://stats.stackexchange.com/questions/38831/wh...
https://en.wikipedia.org/wiki/Feature_selection

Если да, то на моей памяти и из ссылок выше - это почти нереально. У нас в проекте вроде тоже поднимался вопрос, мол как из тысячи различных источников выявить важнейшие факторы влияния конечного результата. Но вроде бы так к решению и не пришли.
Но конкретно в вашем случае я бы вообще очень сильно задумался - а нужно ли вообще машинное обучение?

Еще можно задуматься о классификации параметров продуктов и провести реляцию к итоговому выборов мужчин и женщин.
Ответ написан
@dmshar
Надеюсь, такое понятие, как "корреляция" вам известно. При этом корреляция бывает не только классической, Пирсоновской, измеряемой на количественных данных, но и специальной, приспособленной для работы с ранговыми данными (корреляции Кенделла, Спирмана), с номинальными данными, с дихотомическими данными и с их комбинациями.
Таким образом, для вашего примера можно формально определить, что, например, в группе мужчин с бинарным признаком "купил/не купил" больше коррелирует номинальный признак "материал" чем номинальный признак "цвет", а в группе женщин - наоборот.
Задача достаточно известная и неплохо описанная в любом курсе современного статистического анализа.
Ответ написан
@abbaboka
Мужчины например ориентируются на материал изделия, женщины больше на цвет. Как проранжировать эти условия?


Я бы начал - с адекватного определения обратной связи.
А не с технической реализации.

Ну вот почему вы считаете, что именно так как вы написали? Из каких таких соображений?
А почему не рассматриваете промежуточные значения?
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы