Как решить проблему отсекания ботов в статистике?

Есть API, есть логи этого API. Появилась необходимость эти логи как-то анализировать и хотелось бы, чтобы итоговые цифры были близки к количеству реальных посетителей.
Известных ботов (Яндекс, Гугл, Бинг, Мэйл.ру) отсечь удалось легко - обратным DNS-запросом определяем кому принадлежит IP и фильтруем по маске (например у гугла адреса заканчиваются на googlebot.com).
А вот как быть с менее известными ботами, которых, как показывает статистика, тоже немало - неясно.
Есть мысли, как исходя из данных <дата-время> - вычислить бота?
  • Вопрос задан
  • 2657 просмотров
Пригласить эксперта
Ответы на вопрос 1
Я бы предположил, что у ботов практически детерминированная логика запроса URL - вы будете видеть с одного IP всегда одинаковую последовательность операций. Создайте справочник наборов последовательностей, которые будете расценивать как заход бота.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы