@SouLWorkeR

Как достать png файл с сайта с помощью lxml?

На сайте есть такой блок с вот таким png файлом, как я могу его достать (скачать)?

<div class="reader-view" data-p="2">
   <img src="https://img4.example.me//example1/example2/examples/8-37/02.png">
</div>


Если знаете, как решить, объясните пожалуйста немножко код, все-таки хочу понимать, что к чему.
  • Вопрос задан
  • 92 просмотра
Решения вопроса 1
origami1024
@origami1024
went out for a night walk
from lxml import html
lxml_string = '''<div class="reader-view" data-p="2">
   <img src="https://upload.wikimedia.org/wikipedia/commons/thumb/4/47/PNG_transparency_demonstration_1.png/274px-PNG_transparency_demonstration_1.png">
</div>'''
tree = html.document_fromstring(lxml_string)
pic_path = tree.xpath('//img/@src')[0]

import requests

r = requests.get(pic_path, allow_redirects=True)
open('d:\\02.png', 'wb').write(r.content)


1. Чтобы скачать файл используй либу requests
2. Чтобы спарсить html, используй lxml.html
3. После чего технологией xpath находим нужный атрибут src в нодах img, берем нулевой из всего найденного - конкретно для этого примера
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы