Добрый день!
Есть: адрес страницы
URL, по которому лежит HTML. Нужно закачать все ресурсы, которые эта страница затребует. Есть нюанс :) ! Некоторые ссылки на ресурсы с другим доменом, а ссылка генерируется и работает только для текущей сессии.
Нужен, другими словами, способ
грабить страницу и то, что будет загружаться, но не обязательно показываться в DOM.
Что приходило в голову:
- Selenium DevTools Network и забрать список, скачав первоначальный и после JS window.load HTML.
- PhantomJS открывает далеко не все страницы
- Requests не исполняет код страницы (вроде как), но можно взять все, что нужно Selenium и потом создать сессию на основе данных Selenium и запросить это все через Requests
Спасибо!