Как решить проблему отсекания ботов в статистике?

Question

Александр @aspetek

Как решить проблему отсекания ботов в статистике?

Есть API, есть логи этого API. Появилась необходимость эти логи как-то анализировать и хотелось бы, чтобы итоговые цифры были близки к количеству реальных посетителей.
Известных ботов (Яндекс, Гугл, Бинг, Мэйл.ру) отсечь удалось легко - обратным DNS-запросом определяем кому принадлежит IP и фильтруем по маске (например у гугла адреса заканчиваются на googlebot.com).
А вот как быть с менее известными ботами, которых, как показывает статистика, тоже немало - неясно.
Есть мысли, как исходя из данных <дата-время> - вычислить бота?

Вопрос задан более трёх лет назад
2660 просмотров

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillfactory

DevOps-инженер

6 месяцев

Далее
Хекслет

Фронтенд-разработчик

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Telegram

+1 ещё

Простой
С чего начать, чтобы разбираться в Telegram MiniApp и чётко ставить задачи разработчикам?
- 1 подписчик
- 18 окт.
- 141 просмотр
1

ответ
Telegram

+1 ещё

Простой
Ретранслятор сообщений от бота телеграмма?
- 4 подписчика
- 25 сент.
- 553 просмотра
3

ответа
Telegram

+1 ещё

Средний
Бот телеграмм: подарить подарок. Как?
- 1 подписчик
- 13 сент.
- 168 просмотров
1

ответ
Аналитика

Простой
Где посмотреть примеры оформления кода для экономического анализа данных?
- 1 подписчик
- 11 сент.
- 227 просмотров
2

ответа
Node.js

+4 ещё

Простой
В чем разница между selenium, playwright и puppeteer?
- 3 подписчика
- 09 сент.
- 235 просмотров
2

ответа
Веб-разработка

+1 ещё

Простой
Как защитить сайт от ботов с отказами?
- 2 подписчика
- 03 сент.
- 465 просмотров
3

ответа
Telegram

+1 ещё

Простой
Как убрать кнопку вызова команд бота из ТГ-чата после удаления бота?
- 1 подписчик
- 25 авг.
- 209 просмотров
1

ответ
Аналитика

+1 ещё

Простой
Какие есть эффективные средства анализа больших данных?
- 1 подписчик
- 20 авг.
- 170 просмотров
3

ответа
API

+1 ещё

Простой
Возможно ли написать бота для сайта если там нет API?
- 2 подписчика
- 16 авг.
- 316 просмотров
2

ответа
Python

+2 ещё

Простой
Как анти-бот системы определяют ботов и как от них защищаться?
- 2 подписчика
- 13 авг.
- 369 просмотров
1

ответ
Показать ещё Загружается…

Full-stack разработчик (PHP/Laravel + Node.js)

ЕГЭFlex • Самара

от 80 000 до 120 000 ₽

Тестировщик автоматизатор на Python

United Digital Solutions • Казань

от 150 000 ₽

ML инженер/ AI/ NLP

Vital Partners

от 350 000 до 450 000 ₽

Answer 1 · 2014-02-24 23:27:55

Я бы предположил, что у ботов практически детерминированная логика запроса URL - вы будете видеть с одного IP всегда одинаковую последовательность операций. Создайте справочник наборов последовательностей, которые будете расценивать как заход бота.

Как решить проблему отсекания ботов в статистике?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт