Как сформировать последовательности источников визитов пользователя, которые привели к транзакции на Python?
с помощью Python сформировать последовательности источников визитов пользователя, которые привели к транзакции.
- Источник определяем как связку utm_source + utm_medium.
- Транзакция определяется, как hits.transaction.transactionId соответствует регулярному выражению .*\d+.*
Пример:
- Пользователь, который совершил визит с рекламы Яндекса, а затем с рекламы Google и совершил транзакцию будет иметь цепочку
yandex_cpc => google_cpc
- Пользователь совершил переход из поиска Google, а затем из поиска Яндекс. Транзакций не совершал. Цепочка для него отсутствует.
За готовым результатом обращайтесь на фриланс. За примерами\гайдами - в поисковик.
Здесь помогают решить конкретные проблемы, возникшие в процессе ваших попыток решить задачу.
Danches, вам дана задача. Тот, кто ее дал, ожидает, что вы до этого достаточно овладели предметом, чтобы хотя бы попытаться как-то решать.
Если вы не попытались, значит не владеете предметом. В этом случае это - не вопрос, а задача. На фриланс, как уже сказано выше.
Если попытались, то приведите свои попытки или хотя бы размышления о путях поиска решения, лучше в том виде, в котором ожидаете ответ.
Алан Гибизов, мне кажется я понимаю задачу, и выглядит она для меня так:
Сгруппировать предварительно прометив канал или отметку из которой пришли, потом группировка и сортировка по времени все события по одному айди клиента, дальше сделать оконку по времени через row_number() over (partition by user_id order by time-column),
Дальше склеиваем их через concat с учетом нумерации в оконке.
или
1) упорядочить и пронумеровать события на одного клиента
2) отметить события, которые имеют ютм метку
3) все события маркировать этой меткой со времени данной метки до получения следующего события с новой меткой
Где правильно?
Далее, какие действия выполнить в BQ для подготовки такого фдатасета, чтобы на Питоне было легче скрипт написать. Далее, вопрос по Питону, какие операторы использовать?