Я пытаюсь провести регрессионный анализ. Имеется множество переменных (multiple feature regression). Некоторым переменным для некоторого элемента данных не присвоено значение и они установлены в null. Для порядковых переменных я могу использовать замещение Null-ов средним значением данных. А как быть в случае если переменная категориальная. Например цвет или район города. Для наглядности картинка:
В этом примере данных есть несколько категориальных переменных: цвет, материал, безопасность, тип, район. Как замещать null-ы в таких данных. Или мне взять этот самый Null как отдельный вариант данных (класс) и все? Не слишком ли примитивно это будет?