@picopicopico

Можно ли прогнозировать только по категориальным признакам в ML коих больше 100?

Допустим прогнозирование стоимости дома по 200 признакам, где каждый отдельный дом будет иметь только около 10 признаков (10 не нулевых значений в векторе). Практичны ли такие прогнозы?
  • Вопрос задан
  • 35 просмотров
Пригласить эксперта
Ответы на вопрос 2
@zexer
Вы имеете ввиду, что у одного конкретного дома может иметься 200 признаков, но в основном имеются только 10 признаков, а остальные 190 признаков пустые?
Тогда возникает вопрос, а от дома к дому имеется ли какая-то системность в том, какие признаки являются пустыми, а какие нет? Или же у одного дома не пустыми признаками будут признаки условно x1 - x10, а у другого x150-160?
Сама суть прогнозирования стоимости заключается в том, что выбираются какие-то опорные признаки, которые оказывают влияние на стоимость. Должен быть какой-то признак x5 (а лучше несколько таких признаков), который будет у всех или почти у всех домов, чтобы изменчивость этого признака можно было связывать с изменчивостью цены.
В любом случае, на первый взгляд данные выглядят очень сильно разреженными, что явно не позитивно сказывается на построении каких-то зависимостей.
Так же неплохо было бы знать о количестве записей.
Попробуйте сделать пару базовых моделей, вдруг что-то из этого получится.
Ответ написан
@dmshar
Любой метод - не панацея. Ответ на ваш вопрос - прогнозировать-то можно. Но вот есть-ли зависимость вашего целевого признака от ваших (пусть даже 100) независимых признаков - это совершенно другой вопрос.
Неудача в прогнозировании может быть вызвана как неправильно выбранным методом, так и отсутствии корреляций между входными и выходными признаками.
И, кстати, подбор наиболее адекватных признаков - это одна из самых важных задач в ML.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы