@doktr
Data Scientist

Что узнать, за счет чего растет качество модели?

При добавлении признака в модель (например, нелинейную) растет ее качество. Как понять, выросло качество за счёт добавленного признака или за счёт увеличения сложности модели?

UPD: под сложностью модели не имеется в виду вычислительная сложность. Скорее, речь идет о том, что добавился признак и у деревьев (если их использовать) появилась возможность образовывать более сложное ветвление.
  • Вопрос задан
  • 63 просмотра
Пригласить эксперта
Ответы на вопрос 2
DanilBaibak
@DanilBaibak
Machine Learning engineer
Если модель осталась той же (например, вы не изменили регуляризацию, не добавили пару новых слаев в нейронную сеть), сложность модели не изменилась.

Для оценки признаков используется feature importance. Некоторый библиотеки позволяют делать это "из коробки".
Ответ написан
@dmshar
Сначала надо определиться, а что-же вы понимаете под термином "сложность модели"?
Потому что "сложности" , действительно, бывают разные - как минимум "структурная" и "вычислительная". Но походе, вы их малость перепутали.
Возьмем ваш пример с Random Forest - увеличение количества сплитов не есть увеличение структурной сложности модели. Точно так-же, как и добавление новой переменной к нелинейной регрессионной модели заданного порядка не ведет к увеличению структурной сложности модели. А вот изменение - например - квадратичной модели на кубическую - ведет к изменению и структурной сложности и - как следствие - вычислительной.

Eсли это себе ясно представить, то становиться понятным, что введение нового признака в рамках одной модели - есть действие, результат которого влияет на "качество модели" (кстати, тоже требует определения, но предположим, что вы имеете ввиду "точность"). И структура тут вообще ни при чем. А изменение структуры модели с квадратичной на кубическую может привести к аналогичному увеличению точности модели даже без добавления новых переменных.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы