Вы имеете ввиду, что у одного конкретного дома может иметься 200 признаков, но в основном имеются только 10 признаков, а остальные 190 признаков пустые?
Тогда возникает вопрос, а от дома к дому имеется ли какая-то системность в том, какие признаки являются пустыми, а какие нет? Или же у одного дома не пустыми признаками будут признаки условно x1 - x10, а у другого x150-160?
Сама суть прогнозирования стоимости заключается в том, что выбираются какие-то опорные признаки, которые оказывают влияние на стоимость. Должен быть какой-то признак x5 (а лучше несколько таких признаков), который будет у всех или почти у всех домов, чтобы изменчивость этого признака можно было связывать с изменчивостью цены.
В любом случае, на первый взгляд данные выглядят очень сильно разреженными, что явно не позитивно сказывается на построении каких-то зависимостей.
Так же неплохо было бы знать о количестве записей.
Попробуйте сделать пару базовых моделей, вдруг что-то из этого получится.