@zlodiak

Всегда ли возможно переобучение дерева решений?

Допустим, имеется таблица признаков, состоящая из 100000 записей. Допустим, в ней 4 столбца: первые 3 содержат атрибуты, а четвёртый содержит целевой признак. Скажите пожалуйста, при использовании дерева решений, всегда ли существует опасность излишнего переобучения этого дерева?

Ведь если атрибута всего 3, то это значит, что в дереве решений будет всего 3 уровня. При этом нет никаких гарантий, что 100000 строк успеют перераспределиться таким образом, что каждый лист будет содержать только целевые признаки одного вида
  • Вопрос задан
  • 21 просмотр
Пригласить эксперта
Ответы на вопрос 1
DanilBaibak
@DanilBaibak
Machine Learning engineer
Вопрос достаточно абстрактный. Если задать достаточно большую глубину дерева, то скорее всего алгоритм переобучится. Так же нужно учитывать сам дасасет (например, распределение целевого признака).

Если интересно, можно проверить, как себя ведет дерево решений на существующих датасетах.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы