Как сохранить спарсенные изображения в разные папки?

Question

Сергей Лутченко @baushtelle

Как сохранить спарсенные изображения в разные папки?

Есть задача спарсить изображения с одного сайта. Это изображения объектов недвижимости. Сохраняются они у меня все в одну папку. Вопрос следующий: как мне сохранять их в разные папки соответсвенно объекту недвижимости?

Код сейчас такой:

from urllib.request import urlopen
from urllib.parse import urljoin
from lxml.html import fromstring
import xlsxwriter
 
URL = 'http://amberstarluxury.pt/index.php/ru/2013-07-22-01-32-36'
ITEM_PATH = '.display .propertyaddress'
 
def parse_amber():
    f = urlopen(URL)
    list_html = f.read().decode('utf-8')
    list_doc = fromstring(list_html)
 
    ambers = []

    num = 0

    for elem in list_doc.cssselect(ITEM_PATH):
        a = elem.cssselect('a')[0]
        href = a.get('href')
        name = a.text.strip()
      
        houseUrl = urljoin(URL, href)
           
        amber = {'name':name, 'url':houseUrl}

        #идем внутрь
        detailHouseHtml = urlopen(houseUrl).read().decode('utf-8')
        detailHouseDoc = fromstring(detailHouseHtml)

        #селектор галереи, который здесь без класса :( поэтому делаем  [1][-1]
        galaryList = detailHouseDoc.cssselect('.jwts_tabbertab')[1][-1]
        for pic in galaryList:
            galImg = pic.cssselect('a')
            for picUrl in galImg:
                galImgHref =  picUrl.get('href')
                uopen = urlopen(galImgHref)
                stream = uopen.read()
                file = open('houses/{0}'.format(galImgHref[-10:]),'wb')
                # имена картинок я просто срезаю срезами
                file.write(stream)
                file.close()
                print(galImgHref)

        ambers.append(amber)

        num += 1
        print(num)
  
    return ambers 

 
def export_excel(filename, ambers):
    workbook = xlsxwriter.Workbook(filename)
    worksheet = workbook.add_worksheet()
 
    bold = workbook.add_format({'bold':True})
    field_names = ('Название', 'Описание', 'Ссылка', 'Характеристики')
    for i, field in enumerate(field_names):
        worksheet.write(0, i, field, bold)
 
    fields = ('name', 'descr', 'url')
    for row, amber in enumerate(ambers, start=1):
        for col, field in enumerate(fields):
            worksheet.write(row, col, amber[field])
        for har in amber['har']:
            col +=1
            worksheet.write(row, col, har)
 
    workbook.close( )
 
 
def main():
    ambers = parse_amber()
    # export_excel('amber.xlsx', ambers)
 
if __name__ == '__main__':
    main()

Вопрос задан более трёх лет назад
385 просмотров

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- 19 июл.
- 79 просмотров
1

ответ
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 17 июл.
- 91 просмотр
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 312 просмотров
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 234 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 657 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 550 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 307 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 566 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 228 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 141 просмотр
1

ответ
Показать ещё Загружается…

Answer 1 · 2016-11-18 17:28:50

Может вам нужен os.mkdir()?
Сложно в коде понять, но вы же где то перескакиваете с одного объекта на другой, на каждый объект создаете директорию и картинки сохраняете туда и так по кругу.

Answer 2 · 2016-11-18 18:58:48

Я делал так:

class SaveImg():
    def __init__(self, new_dir_name, images_url):
        os.chdir('images')
        os.mkdir(str(new_dir_name))
        os.chdir(str(new_dir_name))

        count = 1
        for img in images_url:
            img_name = str(count) + '.jpg'
            try:
                urlretrieve(img, img_name)
                count += 1
            except ContentTooShortError as e:
                print(e)
                continue

        os.chdir('..')
        os.chdir('..')

Как сохранить спарсенные изображения в разные папки?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт