У меня есть данные по визитам на ряд страниц сайта, в течении последних 30 дней. Выглядит как-то так:
Страница 1: [1,2,0,4,6,1,7,4,7]
Страница 2: [3,4,12,1,7,1,2,0]
Таких страниц очень много. Мне необходимо вычленить страницы, которые испытывали необычный приток либо отток пользователей, в любой момент времени. Какой алгоритм или последовательность алгоритмов подойдет для этой задачи лучше всего?
UPD: пока смотрю на алгоритм машинного обучения anomalies detection, но возможно есть вариант побыстрее, например (мысли вслух) можно разбивать массивы данных на несколько равных частей и сравнивать их процентные колебания. Если все в пределах 0, тогда можно считать что аномалий нет, если где-то скачок - значит что-то пошло не так. Скорее всего, так и буду делать.