@alexey_ch

Есть ли какие-нибудь методы для борьбы с отсутствующими данными?

Суть в том, что есть выборка - 6 признаков, все вещественные числа. Решается задача бинарной классификации. Но особенность выборки в том, что есть отсутствующие данные. Не пропущенные, а именно отсутствующие.
Как вариант, добавить бинарные признаки (есть данные или нет)
Какие есть ещё методы, которые позволяют работать с такого рода данными?
  • Вопрос задан
  • 106 просмотров
Пригласить эксперта
Ответы на вопрос 2
@dmshar
Что означает "Не пропущенные, а именно отсутствующие.". Правильно-ли я понимаю, что например, признак А для объекта Х - присутствует, а для объекта Y - нет? Ну тогда надо выбрать соответствующий метод решения. Например, для задачи классификации методы на основании деревьев решений не требуют совпадения набора признаков для всех объектов.
Ответ написан
@rPman
Решение в лоб, так как признаков у вас мало, ищите по отдельности для всех комбинаций присутствующих признаков (т.е грубо говоря если например у вас 6 признаков и в данных могут отсутствовать одновременно по 1 и 2 признака, то у делите выборку на 20 частей по всем возможным комбинациям пропущенных признаков и для каждой ищите свой классификатор).

Иногда, если у признаков можно подобрать такое значение, когда их влияние на результат почти нулевое и главное в выборке эти значения не встречаются, то можно выставлять для неизвестных значений такие вырожденные (например значение - расстояние до воздействуемого объекта, делайте его очень большим или наоборот нулевым). Так как вы классифицируете данные а не получаете какую то оценку в виде значения, это может быть оправдано.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы