Ответы пользователя по тегу Регрессионный анализ
  • Какой алгоритм регрессии выбрать для шумных (разбросанных) данных?

    angrySCV
    @angrySCV
    machine learning, programming, startuping
    какого хрена на графике все параметры смешаны?
    вполне очевидно что каждый параметр вносит влияние в модель с определённым весом, вам нужно подобрать веса для этих параметров.
    начните с линейной зависимости, потом можно перейти на полиномы 2го или 3го порядка если уж вам так не терпиться.
    вы же можете везде оценивать суммарную ошибку (стоимость), какая модель с меньшей ошибкой, такая типа и лучше.
    Ответ написан
    Комментировать
  • Как обработать null значения переменных в регрессии (машинное обучение)?

    angrySCV
    @angrySCV
    machine learning, programming, startuping
    вы как исследователь данных сами должны решить что делать с пропусками,
    обычно есть несколько типовых вариантов:
    1. выкинуть эти данные (не подходит если очень мало данных, и каждые на вес золота)
    2. заполнить какими-нибудь значениями типовыми, например нулями (если речь о количестве например) , или средними значениями если например это год (писать например 2005)
    3. восстановить эти данные (для этого уже нужны определённые подходы и алгоритмы. например, используя соседей, к-mean, коллаборативной фильтрацией.)
    у вас вобще тут совсем простая задача -> предположительно цена это результат комбинации набора параметров.
    отсюда вы можете оценить влияние каждого параметра на цену. особенно имея схожие значения.
    начинайте сначала с простых вещей -> там где CONDITION NEW -> очевидно что YEAR = ~ 2015
    потом можно составить систему уравнений -> типа
    YEAR*x+Storey*y+Area*z+Condition*n+Type*m+District*k=PRICE
    можно легко составить систему из 5 уровнений, и найти коэффициэнты любым удобным для вас способом например Гауссом.
    (PS если данных мало то district можно пренебречь)
    Ответ написан
    2 комментария