Всем добра,
Вопрос по языку R (наверное). Есть много строчек текста типа ID клиента и дата.
ID клиента повторяются, могут быть и два раза в один день. Как подсчитать Streak-и?
Стрик это когда ID клиента повторяется изо дня в день, скажем позавчера и вчера это двойной стрик а позавчера, вчера и сегодня это тройной стрик. В тоже время с 1 по 11 февраля и с 13 по 15 февраля это два стрика один 10 дней и один - дня, интересует максимальный стрик.
max(rle(as.character(data[data["id"]==1,"date"]))[[1]])
Т.е. предложение такое:
1. Отобрать все даты по одному ID
2. Сделать rle() по столбцу с датами, он выявит последовательные цепочки и их длины
3. Найти максимум