Как сервер различает, запросы сделанные с помощью Python, от запросов сделанные Браузером?

Question

Mr.Robot @Dunaevlad

Python

Как сервер различает, запросы сделанные с помощью Python, от запросов сделанные Браузером?

Интересует, как сильно отличается запрос сделанный с помощью Python(requests или httpx) от запроса идущего с любого другого браузера? Есть ли различия?
По идее, это набор одних и тех же битов.
Как сервер понимает, что у клиента, который шлет запрос, нет JS обработчика.

Заранее, всем спасибо за ответ.

Вопрос задан более трёх лет назад
221 просмотр

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее
Skillfactory

Профессия Python-разработчик

9 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее

Решения вопроса 2

Комментировать

Пригласить эксперта

Ответы на вопрос 1

4 комментария

Mr.Robot @Dunaevlad Автор вопроса

Окей, тогда почему, при включении всех заголовков в Python requests, в ответ вылазит ошибка или проверка капчей? Тот же запрос от браузера, не шлет в ответ капчу

Написано более трёх лет назад
shurshur @shurshur

Master Ruby, есть множество способов. Например, поведенческий анализ. Вряд ли обычный пользователь запросит 1000 страниц сайта за 5 минут.

Кроме того, во многих защитных механизмах особенно внимательно мониторят сети хостеров. Например, с моей виртуалки в Hetzner некоторые сайты не работают, а на некоторых капча каждый день вылазит.

Написано более трёх лет назад
Mr.Robot @Dunaevlad Автор вопроса

shurshur, согласен, 1000 страниц - 5 сек, тут все ясно, но если это cloudflare? тУт и 1 запрос не пройдет, у меня есть мысли, как можно обойти, но перед этим, я хочу собирать инфу.

Написано более трёх лет назад
shurshur @shurshur

Master Ruby, cloudflare дико умный, он всё учитывает, что только можно, и обойти его рабоче-крестьянскими средствами крайне сложно.

Самый рабочий и простой способ - открыть с того же IP браузером сайт и затем перенести полученные куки в скрипт. Но CF в любой момент может впулить юзеру скрипт, который потребует обновить эти куки, ну или покажет капчу. На некоторых сайтах CF показывает капчу минимум раз в сутки любым пользователям, без разбору.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Каким образом я могу запускать привязанных ботов в основном, что-бы основной loop не ломался и не дублировался?
- 1 подписчик
- 15 нояб.
- 153 просмотра
0

ответов
Python

Простой
Почему конвертация .py файла в .exe с помощью auto-py-to-exe происходит аномально долго и как это исправить?
- 1 подписчик
- 08 нояб.
- 213 просмотров
0

ответов
Python

+2 ещё

Простой
Как решить ошибку с отправкой почты через Outlook SMTP?
- 1 подписчик
- 08 нояб.
- 146 просмотров
0

ответов
Python

+2 ещё

Средний
Как конвертировать drawio (xml) в xml zabbix map?
- 2 подписчика
- 08 нояб.
- 112 просмотров
1

ответ
Python

Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
- 2 подписчика
- 31 окт.
- 250 просмотров
0

ответов
Python

Простой
Как сформировать изображение GS1 DataMatrix с функциональными знаками?
- 1 подписчик
- 31 окт.
- 136 просмотров
0

ответов
Python

+1 ещё

Простой
Почему callback_query_handler в telebot не работает?
- 1 подписчик
- 31 окт.
- 140 просмотров
3

ответа
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт.
- 142 просмотра
0

ответов
Python

Простой
Что делать если turtle в python не отвечает?
- 1 подписчик
- 22 окт.
- 259 просмотров
2

ответа
Python

Простой
Не могу разобраться почему не работает код python?
- 1 подписчик
- 22 окт.
- 426 просмотров
1

ответ
Показать ещё Загружается…

Backend developer (Python, FastAPI)

BCraft

До 4 000 $

Backend Python Developer Middle/Senior

AppRoute

До 3 000 $

Python back-end engineer (+Kotlin)

YoloPrice

от 360 000 до 420 000 ₽

Answer 1 · 2021-09-23 14:33:19

можно еще проверять, запросил ли потом ещё какой-то URL, по инициативе JS.

Закрыл ли соединение, или это HTTP/2.

Answer 2 · 2021-09-23 19:26:33

1. Просто, но эффективно - заголовки запроса, в т.ч.

User-Agent
Cookie
Referer

Также легко подделывается.
2. Использование штук типа prefetch и тому подобных. Если клиент запросил страницу, но не запросил сразу же стили/скрипты на ней - возможно, это бот. Просто, но рискованно (можно забанить обычных людей) и затратно (нужно анализировать отдачу статики).
3. Исполнение JS-кода - например, предлагает клиенту выполнить фоновый AJAX-запрос, который поставит специальную куку. Минус - работает только со второго запроса. Обходится безголовым браузером типа selenium.

Answer 3 · 2021-09-23 13:50:07

Владислав Лысков @Vlatqa

очевидно, по заголовкам

Ответ написан более трёх лет назад

4 комментария

Как сервер различает, запросы сделанные с помощью Python, от запросов сделанные Браузером?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт