Необходимо определить пики активностей клиентов во временном промежутке используя БД (временные интервалы не пересекаются). В какую сторону двигаться?

Подробное описание вопроса. Есть БД с данными о посещении клиентов. Надо эти данные сгруппировать. Рассматриваемый промежуток времени принимаем за единицу. Какой метод кластеризации подойдет к этой задаче лучше? Какие библиотеки Python использовать?
  • Вопрос задан
  • 188 просмотров
Пригласить эксперта
Ответы на вопрос 2
@mletov
Вопрос про сферического коня в вакууме.

Вы же данные сгруппировать хотите не для галочки, а для анализа. А раз так, то поговорите с вашим аналитиком (SEOшником, маркетологом... короче, тем, кто эти данные будет использовать), в каком виде ему было бы удобнее эти данные видеть.

Примеры можно посмотреть в личном кабинете Яндекс.Метрики. Там есть отчеты и диаграммы по посещаемости всех сортов и мастей.

Что касается технической реализации, то весьма вероятно, что вам нужно посмотреть в первую очередь в сторону написания больших SQL запросов, а либы для Python - дело десятое. Хотя это уже вкусовщина, можно и через ORM делать.
Ответ написан
xmoonlight
@xmoonlight
https://sitecoder.blogspot.com
Сравнение отношений за раличные и РАВНЫЕ! временные промежутки:
[общее кол-во запросов]*[кол-во уникальных клиентов]/([общее кол-во запросов]+[кол-во уникальных клиентов])
Чем больше дробь, тем выше активность.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы