• Есть ли какие-нибудь методы для борьбы с отсутствующими данными?

    @rPman
    Решение в лоб, так как признаков у вас мало, ищите по отдельности для всех комбинаций присутствующих признаков (т.е грубо говоря если например у вас 6 признаков и в данных могут отсутствовать одновременно по 1 и 2 признака, то у делите выборку на 20 частей по всем возможным комбинациям пропущенных признаков и для каждой ищите свой классификатор).

    Иногда, если у признаков можно подобрать такое значение, когда их влияние на результат почти нулевое и главное в выборке эти значения не встречаются, то можно выставлять для неизвестных значений такие вырожденные (например значение - расстояние до воздействуемого объекта, делайте его очень большим или наоборот нулевым). Так как вы классифицируете данные а не получаете какую то оценку в виде значения, это может быть оправдано.
    Ответ написан
    Комментировать
  • Есть ли какие-нибудь методы для борьбы с отсутствующими данными?

    @dmshar
    Что означает "Не пропущенные, а именно отсутствующие.". Правильно-ли я понимаю, что например, признак А для объекта Х - присутствует, а для объекта Y - нет? Ну тогда надо выбрать соответствующий метод решения. Например, для задачи классификации методы на основании деревьев решений не требуют совпадения набора признаков для всех объектов.
    Ответ написан
    1 комментарий