NortaBirdo: убрать и оценить, хватает ли выборки
насколько я помню теорию выборка делится: 70% обучение, 30% тест
так что
мощность обучающей выборки * 0.7 >>> 2 * колличество независимых параметров
При чем одинаковость параметра для все выборки- самый базовый признак, что он не нужен в обчающей выборке. Там еще есть более хитрые методы удаления дублирующихся признаков, но какие конкретно лучше посмотреть в спецкурсах по теме
NortaBirdo: если все признаки значимые, то насколько я помню комбинаторику, полный выборка, в которой будут все признаки = 2 * 447 >>> 400
Если признаки повторяются (одинаковы для всех), то возможно они не значимые и их можно просто удалить из выборки
слишком рана такими оптимизациями заниматься