@del4pp

Парсинг сайтов, как обойти защиту?

Здравствуйте.
При парсинге сайта с домашнего пк выдает нужную информацию, но когда использую сервер + прокси - каждая страница сайта имеет одну и ту же структуру html страницы, из-за чего парсер ловит ответ 403
Пробовал разные прокси, кто подскажет как обойти?
  • Вопрос задан
  • 395 просмотров
Решения вопроса 1
hottabxp
@hottabxp Куратор тега Python
Сначала мы жили бедно, а потом нас обокрали..
Рекомендую программу RSocks Proxy Checker Есть версии и под linux. Загружаете в неё список прокси, и указываете сайт для проверки 'ruru.hotmo.org '. По окончанию проверки, сортируете результаты по "200 OK" и сохраняете такие прокси. Только что проверил на python, работает.
5ea5e26769948796051262.png
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
dimonchik2013
@dimonchik2013
non progredi est regredi
надежные прокси

чекаются заранее на конкретном сайте

Гуглы и монстры (типа Амазона) просто так не пробить
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы