Как достать png файл с сайта с помощью lxml?

Question

SouLWorkeR @SouLWorkeR

Как достать png файл с сайта с помощью lxml?

На сайте есть такой блок с вот таким png файлом, как я могу его достать (скачать)?

<div class="reader-view" data-p="2">
   <img src="https://img4.example.me//example1/example2/examples/8-37/02.png">
</div>

Если знаете, как решить, объясните пожалуйста немножко код, все-таки хочу понимать, что к чему.

Вопрос задан более трёх лет назад
106 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

4 комментария

SouLWorkeR @SouLWorkeR Автор вопроса

На сайте, с которого я скачиваю, сначала идет некая гифка пока png файлы прогрузится, а потом уже появляются png файлы. Пайтон не ожидает погрузки, а сразу скачивает, можно ли решить эту проблему?

Написано более трёх лет назад
ScriptKiddo @ScriptKiddo

SouLWorkeR, Если для подгрузки изображений используется JS - тогда делайте парсинг через Selenium

Написано более трёх лет назад
SouLWorkeR @SouLWorkeR Автор вопроса

ScriptKiddo, благодарю

Написано более трёх лет назад
origami1024 @origami1024

Легче найти где хранится адрес реального изображения, который ставится вместо гифки, большой шанс, что это какой-то аттрибут тэга типа data-image у того же img, если это какой-то онлайн магазин

Написано более трёх лет назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- вчера
- 69 просмотров
1

ответ
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 17 июл.
- 86 просмотров
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 293 просмотра
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 233 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 647 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 550 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 307 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 563 просмотра
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 227 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 140 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2020-06-19 12:56:53

from lxml import html
lxml_string = '''<div class="reader-view" data-p="2">
   <img src="https://upload.wikimedia.org/wikipedia/commons/thumb/4/47/PNG_transparency_demonstration_1.png/274px-PNG_transparency_demonstration_1.png">
</div>'''
tree = html.document_fromstring(lxml_string)
pic_path = tree.xpath('//img/@src')[0]

import requests

r = requests.get(pic_path, allow_redirects=True)
open('d:\\02.png', 'wb').write(r.content)

1. Чтобы скачать файл используй либу requests
2. Чтобы спарсить html, используй lxml.html
3. После чего технологией xpath находим нужный атрибут src в нодах img, берем нулевой из всего найденного - конкретно для этого примера

Как достать png файл с сайта с помощью lxml?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт