Задать вопрос
@pastecopier

Как получить html страницы, защищенного от парсинга сайта?

При открытии исходного кода страницы: https://www.off---white.com/en/RU/section/new-arrivals в браузере отображается корректный html.
При отправке http get запроса с использованием user-agent, html блокируется и выводится непонятный скрипт на всех страницах сайта одинаковый, за исключением куки
Python:
headers= {"User-Agent":"Mozilla/5.0 (iPhone; CPU iPhone OS 12_3_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/12.1.1 Mobile/15E148 Safari/604.1"}
url = 'https://www.off---white.com/en/RU/section/new-arrivals'
r = requests.get(url, headers=headers)
print(r.text)

Возможно защита связана с cdn cloudflare или variti. Как можно обойти защиту и получить доступ к html?
  • Вопрос задан
  • 1715 просмотров
Подписаться 3 Простой 3 комментария
Помогут разобраться в теме Все курсы
  • Skillfactory
    Профессия Fullstack веб-разработчик на JavaScript и PHP
    20 месяцев
    Далее
  • Хекслет
    PHP-разработчик
    10 месяцев
    Далее
  • Нетология
    Веб-разработчик с нуля: профессия с выбором специализации
    14 месяцев
    Далее
Пригласить эксперта
Ответы на вопрос 1
dimonchik2013
@dimonchik2013
non progredi est regredi
Selenium юзай

там JS / metarefresh проверка, requests не справится
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы