Qwentor
@Qwentor
Веб-программист

Как скрипту на Python 3 максимально прикинуться браузером?

Собственно сабж. Парсинг. Что проверяют сайты кроме ip? По ip не банят, т.к. после отвала скрипта с браузера захожу спокойно. Как сделать, чтоб меня не палили и считали браузером? Слипы стоят. Юзерагент от фаерфокса виндового
  • Вопрос задан
  • 1050 просмотров
Пригласить эксперта
Ответы на вопрос 4
Сильно максимально не поучится потому что он мышкой всё равно двигать никак не сможет. Тогда уж вам нужен phantom.js
Ответ написан
Комментировать
fox_12
@fox_12 Куратор тега Python
Расставляю биты, управляю заряженными частицами
Смотреть какие заголовки передает броузер (User-Agent и прочие), и подставлять такие же.
Использовать куки.
В особо сложных случаях использовать Selenium webdriver.
Ответ написан
vladkozlovski
@vladkozlovski
Inventor. Rebel. Entrepreneur.
Всё просто: если вы хотите полностью прикинуться браузером, то вам надо стать настоящим браузером. Для самых сложных случаев я использую пакет https://github.com/niklasb/dryscrape. В двух словах это биндинг к WebKit.

Проверки могут стоят самые разные: начиная от обычной проверки заголовка User-Agent и заканчивая AJAX запросами с параметрами, которые сгенерировал JavaScript в браузере.
Ответ написан
Комментировать
@inkvizitor68sl
Linux-сисадмин с 8 летним стажем.
chrome -> f12 -> network -> refresh page -> copy as curl
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы