@Vovan2005

Как избежать переадресации при парсинге сайта?

Я занимаюсь парсингом сайта на python c помощью BF4. Все страницы кроме одной парсятся без проблем. Но проблемную страницу не удаётся считать из-за того, что после обращения к этой странице она перенапрявляет меня на главную.
За это отвечает какой-то скрипт? И как в теории обойти это переадресацию?
  • Вопрос задан
  • 716 просмотров
Пригласить эксперта
Ответы на вопрос 1
@cashncarry
нагуглили
Если коротко — никак)
Сама суть редиректа в этом. Страница это ссылка на другую страницу
Но если вам нужно отлавливать переадресации, можно использовать "status_code"
r = requests.get(url)
if r.status_code in [301, 302]:
    #  переадресация


Если используете requests посмотрите этот пример
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
23 нояб. 2024, в 01:31
1000 руб./за проект
23 нояб. 2024, в 00:16
2000 руб./за проект