Как правильно заполнить пропущенные значения бинарных признаков?
Например, если признаком является пол, и в таблице присутствуют пустые значения в колонке пол.
Или признак со значениями "Город" и "Деревня", описывающий, где находится объект.
Если перевести "Город" в 1, a "Деревня" в 0, то что делать с пустыми полями.
На ваш выбор:
1. Заполнять самым частым
2. Прогнозировать отсутствующее значение на основе других признаков
3. Сделать "Отсутствует" отдельным значением признака
Если это ключевой признак, то выбросить вообще такие кривые данные. А то представьте, у вас там поле "Получил ЗП", и напротив вашей фамилии так вот рандомно появилось "1".