На что обращать внимание при подготовке данных для обучения модели?
Здравствуйте. Я в машинном обучении новичок. Поэтому возник вопрос. Как правильно подготавливать данные для обучения? У меня есть куча признаков, но я не знаю какие из них важные, какие нет. Пробовал считать корреляцию, но там все коэффициенты близкие к нулю получаются. Поэтому не ясно чем руководствуются люди когда некоторые переменные удаляют, некоторые видоизменяют или агрегируют или вообще вводят новые переменные. Скорее всего тут необходимы знания предметной области. Но что если их нету? Существуют ли какие либо признаки кроме корреляции? Или единственный способ проверить это непосредственно моделировать и смотреть как получилось? Заранее спасибо!