Как решить проблему отсекания ботов в статистике?

Есть API, есть логи этого API. Появилась необходимость эти логи как-то анализировать и хотелось бы, чтобы итоговые цифры были близки к количеству реальных посетителей.
Известных ботов (Яндекс, Гугл, Бинг, Мэйл.ру) отсечь удалось легко - обратным DNS-запросом определяем кому принадлежит IP и фильтруем по маске (например у гугла адреса заканчиваются на googlebot.com).
А вот как быть с менее известными ботами, которых, как показывает статистика, тоже немало - неясно.
Есть мысли, как исходя из данных <дата-время> - вычислить бота?
  • Вопрос задан
  • 2657 просмотров
Пригласить эксперта
Ответы на вопрос 1
Я бы предположил, что у ботов практически детерминированная логика запроса URL - вы будете видеть с одного IP всегда одинаковую последовательность операций. Создайте справочник наборов последовательностей, которые будете расценивать как заход бота.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы