Wacdis
@Wacdis
PHP, Python, GO, Rust, NodeJS, SOA/MSA

Как скачать динамически подгружающиеся ресурсы страницы при помощи Python?

Добрый день!

Есть: адрес страницы URL, по которому лежит HTML. Нужно закачать все ресурсы, которые эта страница затребует. Есть нюанс :) ! Некоторые ссылки на ресурсы с другим доменом, а ссылка генерируется и работает только для текущей сессии.

Нужен, другими словами, способ грабить страницу и то, что будет загружаться, но не обязательно показываться в DOM.

Что приходило в голову:
  • Selenium DevTools Network и забрать список, скачав первоначальный и после JS window.load HTML.
  • PhantomJS открывает далеко не все страницы
  • Requests не исполняет код страницы (вроде как), но можно взять все, что нужно Selenium и потом создать сессию на основе данных Selenium и запросить это все через Requests


Спасибо!
  • Вопрос задан
  • 56 просмотров
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы