@termitik

Как выбрать данные для классификации случайным лесом?

Всем привет!
В общем мне необходимо изучить classification random forest.
Вроде бы по методу частично понятно. А как быть с данными. Они должны быть изначально разбиты на классы, или на классы разбиваются самостоятельно? Тогда по какому алгоритму? И какое количество классов оптимально?
  • Вопрос задан
  • 90 просмотров
Пригласить эксперта
Ответы на вопрос 1
@dmshar
А вы точно изучали теорию?
Задачи классификации (все, независимо от метода) - на вход принимают РАЗМЕЧЕННЫЙ набор данных по которым строят классификатор, а вашем случае - дерево или лес. Потом полученный классификатор используется для отнесения вновь поступающих данных к одному из классов.
"Самостоятельное" ( в вашей трактовке) разбиение на классы - это уже другая задача - кластеризаця.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы