Задать вопрос
@arseny_sitdikov

Существует ли алгоритм ML, работающий с панельными данными, как это происходит в МНК?

Занимаюсь решением задачи прогнозирования оттока.
Возник вопрос при формировании выборки. Возможно ли сформировать выборку так, чтобы в ней учитывался временной характер. т.е к примеру, выборка показывает момент очередной расчётной даты и, следовательно, клиент принимает решение продолжать пользоваться услугой или нет.
Метод анализа панельных данных часто реализуется в эконометрике. Поэтому и задался вопросом. Существует ли алгоритм который понимает, что на вход в него идут панельные данные и что у каждой строки есть id абонента.

К примеру, клиент Лёха. У него id 178. Период наблюдения за ним 6 месяцев. И каждый месяц для него это отдельная строка с его отобранными характеристиками. Для каждой такой строки id 178, соответственно. Или нужно задавать df, как панель?

Видел много работ по прогнозированию оттока, но нигде не видел обсуждений структуры таких данных и возможности анализа панельных данных.
  • Вопрос задан
  • 500 просмотров
Подписаться 3 Средний Комментировать
Решения вопроса 1
@dmshar
Что-то вы намешали все в одну кучу.
Панельные данные используются не только в эконометрике. Более того, методы работы с панельными данными существуют сами по себе, а уж используются и в эконометрике тоже.
На счет "реализации в эконометрике" - будет интересно ознакомиться со ссылочкой именно на "реализацию", хоть в одном из распространенным пакетов.
Что касается противопоставления ML и МНК - тоже весьма загадочная фраза. МНК - это некий математический метод, лежащий в основе многих прикладных методов, в том числе - регрессионного анализа, который вполне успешно и широко используется в машинном обучении.
Возвращаемся к панельным данным. Имеется модуль linearmodels (https://bashtage.github.io/linearmodels/index.html#) в котором есть целая группа методов работы с панельными данными:
https://bashtage.github.io/linearmodels/panel/inde...
Пользуйтесь на здоровье.
P.S. Кстати, в реальных задачах часто можно ограничиться просто многомерной регрессией, одним из параметров которой есть время. Попробуйте и так.
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы