Как скачать динамически подгружающиеся ресурсы страницы при помощи Python?

Question

Ross Alex @Wacdis

PHP, Python, GO, Rust, NodeJS, SOA/MSA

Python

Как скачать динамически подгружающиеся ресурсы страницы при помощи Python?

Добрый день!

Есть: адрес страницы URL, по которому лежит HTML. Нужно закачать все ресурсы, которые эта страница затребует. Есть нюанс :) ! Некоторые ссылки на ресурсы с другим доменом, а ссылка генерируется и работает только для текущей сессии.

Нужен, другими словами, способ грабить страницу и то, что будет загружаться, но не обязательно показываться в DOM.

Что приходило в голову:

Selenium DevTools Network и забрать список, скачав первоначальный и после JS window.load HTML.
PhantomJS открывает далеко не все страницы
Requests не исполняет код страницы (вроде как), но можно взять все, что нужно Selenium и потом создать сессию на основе данных Selenium и запросить это все через Requests

Спасибо!

Вопрос задан более трёх лет назад
60 просмотров

3 комментария

Подписаться 1 Средний 3 комментария

Алан Гибизов @phaggi Куратор тега Python

См.п.3.1, 3.4, 5.2
Рекомендую убрать тег python (т.к. нет ни кода, ни специфики языка в вопросе); если надо уточнить, что вы используете Python, напишите об этом в названии или теле вопроса. (п.3.1 Правил)
Рекомендую убрать лирику из вопроса.(п.3.4 Правил)
Рекомендую изменить подпись в профиле для исполнения п.5.2 Правил (отправлена жалоба).

Написано более трёх лет назад
Алан Гибизов @phaggi Куратор тега Python

Также рекомендую воспользоваться поиском по ресурсу - вопрос задавался неоднократно.

Написано более трёх лет назад
Ross Alex @Wacdis Автор вопроса

Алан Гибизов, спасибо! Сейчас гляну...

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Каким образом я могу запускать привязанных ботов в основном, что-бы основной loop не ломался и не дублировался?
- 1 подписчик
- 15 нояб.
- 194 просмотра
0

ответов
Python

Простой
Почему конвертация .py файла в .exe с помощью auto-py-to-exe происходит аномально долго и как это исправить?
- 1 подписчик
- 08 нояб.
- 234 просмотра
0

ответов
Python

+2 ещё

Простой
Как решить ошибку с отправкой почты через Outlook SMTP?
- 1 подписчик
- 08 нояб.
- 153 просмотра
0

ответов
Python

+2 ещё

Средний
Как конвертировать drawio (xml) в xml zabbix map?
- 2 подписчика
- 08 нояб.
- 127 просмотров
1

ответ
Python

Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
- 2 подписчика
- 31 окт.
- 255 просмотров
0

ответов
Python

Простой
Как сформировать изображение GS1 DataMatrix с функциональными знаками?
- 1 подписчик
- 31 окт.
- 141 просмотр
0

ответов
Python

+1 ещё

Простой
Почему callback_query_handler в telebot не работает?
- 1 подписчик
- 31 окт.
- 142 просмотра
3

ответа
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт.
- 146 просмотров
0

ответов
Python

Простой
Что делать если turtle в python не отвечает?
- 1 подписчик
- 22 окт.
- 263 просмотра
2

ответа
Python

Простой
Не могу разобраться почему не работает код python?
- 1 подписчик
- 22 окт.
- 431 просмотр
1

ответ
Показать ещё Загружается…

Backend Python Developer Middle/Senior

AppRoute

До 3 000 $

Python back-end engineer (+Kotlin)

YoloPrice

от 360 000 до 420 000 ₽

Junior Python Developer

ITK academy • Воронеж

от 75 000 ₽

См.п.3.1, 3.4, 5.2
Рекомендую убрать тег python (т.к. нет ни кода, ни специфики языка в вопросе); если надо уточнить, что вы используете Python, напишите об этом в названии или теле вопроса. (п.3.1 Правил)
Рекомендую убрать лирику из вопроса.(п.3.4 Правил)
Рекомендую изменить подпись в профиле для исполнения п.5.2 Правил (отправлена жалоба).
Также рекомендую воспользоваться поиском по ресурсу - вопрос задавался неоднократно.
Алан Гибизов, спасибо! Сейчас гляну...

Как скачать динамически подгружающиеся ресурсы страницы при помощи Python?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт