Почему методы класса не работают в цикле?

Question

Uno di Palermo @rogerCopy

Python

Почему методы класса не работают в цикле?

Приветствую, пожалуйста, прошу тех, кто может - помочь. Суть: есть словарь скажем из 5 ссылок, по которым в цикле надо запустить 3 метода класса: 1. создать папку с направлением (если такого нету) и в ней папку с именем художника, 2. создать файл .log с ссылками на картины

logging.basicConfig(filename=f'{path}/{school}/{artist_name}/list_of_all_works_of_{artist_name}.log', level=logging.INFO, format=FORMAT)

,
3. скачать картины, ссылки на которые записаны в данный файл

Вот так:

for i in ar_deco:
    w = Wikiart()
    w.create_folder(i)
    w.get_list_of_all_works(i)
    w.download_images(i)
    del w

Если в словаре 1 ссылка, работает. Если больше - на второй выдает ошибку

Traceback (most recent call last):
  File "G:\Desktop\py\wikiart\wikiart.py", line 285, in <module>
    w.download_images(i)
  File "G:\Desktop\py\wikiart\wikiart.py", line 227, in download_images
    f = open(f'{path}/{school}/{artist_name}/list_of_all_works_of_{artist_name}.log', 'r').readlines()
FileNotFoundError: [Errno 2] No such file or directory: 'G:/Desktop/py/wikiart/Экспрессионизм/Erin Hanson/list_of_all_works_of_Erin Hanson.log'

т.е. выполняются методы w.create_folder(i) и w.download_images(i), но не w.get_list_of_all_works(i).

Сам код:

import requests
from bs4 import BeautifulSoup as bs
import re, os, sys,
import logging
from wget import download

ar_deco = [
    "https://www.wikiart.org/ru/francois-pompon/all-works/text-list",
    "https://www.wikiart.org/ru/aleksandra-ekster/all-works/text-list"
]

FORMAT = '%(message)s'

path = os.path.abspath(os.path.dirname(sys.argv[0])).replace('\\', '/')

BASE_URL = 'https://wikiart.org'

headers = {
    "user-agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36"
}

class Wikiart:

    def get_soup(self, url):
        session = requests.Session()
        r = session.get(url, headers=headers)
        soup = bs(r.content, 'html.parser')

        return soup

    def get_artist_name(self, url):
        soup = self.get_soup(url)
        artist_name = soup.find('a', class_='artist-href').text.replace(':', '')

        return artist_name.strip()

    def get_school(self, url):
        soup = self.get_soup(url)
        school = soup.find('div', class_='wiki-breadcrumbs-links').find_all('a')[2].text.strip()

        return school.strip()

    def create_folder(self, url):
        artist_name = self.get_artist_name(url)
        school = self.get_school(url)

        if os.path.exists(f'{path}/{school}/{artist_name}'):
            print(f'Exists: {path}/{school}/{artist_name}')
            sys.exit()

        if not os.path.exists(f'{path}/{school}'):
            os.mkdir(f'{path}/{school}')
            print(f'Created: {path}/{school}')

        if not os.path.exists(f'{path}/{school}/{artist_name}'):
            os.mkdir(f'{path}/{school}/{artist_name}')
            print(f'Created: {path}/{school}/{artist_name}')


    def get_list_of_all_works(self, url):
        artist_name = self.get_artist_name(url)
        school = self.get_school(url)

        logging.basicConfig(
            filename=f'{path}/{school}/{artist_name}/list_of_all_works_of_{artist_name}.log', 
            level=logging.INFO, 
            format=FORMAT
        )
        
        soup = self.get_soup(url)
        arts = soup.find_all('li', class_='painting-list-text-row')

        for link in arts:
            img = BASE_URL + link.a['href']
            title = link.text.replace(', ?', '')
            logging.info(img)

        return

    def download_images(self, url):
        artist_name = self.get_artist_name(url)
        school = self.get_school(url)
        
        f = open(f'{path}/{school}/{artist_name}/list_of_all_works_of_{artist_name}.log', 'r').readlines()

        num_of_lines = sum(1 for _ in f)
        n = 0

        forbidden_symbols = ('*,<>:\'\\"/\|?=')

        try: 
            for _ in f:
                soup = self.get_soup(_.strip())
            
                try:
                    img = soup.find('img', itemprop='image')['src']
                except:
                    pass

                try:
                    title = soup.find('div', class_='wiki-breadcrumbs wiki-breadcrumbs-artwork'). \
                                 find_all('a')[5].text. \
                                 replace('"', '_')
                except:
                    pass

                session = requests.Session()
                try:
                    img_r_ = session.get(img)
                except Exception as e:
                    print(e)
                    continue 

                con = img_r_.content

                file_name = f'{path}/{school}/{artist_name}/{title}_{n}.jpg'
                
                try:
                    outf = open(file_name, "wb")
                    outf.write(con)
                    outf.close()
                except:
                    pass

                print(f'{img} : {title} ({n} from {num_of_lines})') 
                
                n += 1

        except Exception as e:
            raise(e)
            pass 


for i in ar_deco:
    w = Wikiart()
    
    w.create_folder(i)
    w.get_list_of_all_works(i)
    w.download_images(i)

    del w

Вопрос задан более трёх лет назад
151 просмотр

Комментировать

Подписаться 1 Простой Комментировать

Решения вопроса 1

4 комментария

Uno di Palermo @rogerCopy Автор вопроса

благодарствую,

Кроме того, зачем пересоздавать wikiart() в цикле?

а почему это вредно?

Написано более трёх лет назад
Vindicar @Vindicar

Uno di Palermo, ну не то чтобы вредно, но зачем? Если объект wikiart не пригоден к повторному использованию, то тогда да, его нужно создать заново. А если пригоден, то почему бы не использовать его для всех загрузок? Незачем делать лишнюю работу.

Написано более трёх лет назад
Uno di Palermo @rogerCopy Автор вопроса

Vindicar, я думал он типа "забивается" результатами старого

Написано более трёх лет назад
Vindicar @Vindicar

Uno di Palermo, я это и имел ввиду, говоря про пригодность к повторному использвоанию. Хорошо написанный класс не "забивается". =)

Написано более трёх лет назад

Пригласить эксперта

Ответы на вопрос 1

2 комментария

Uno di Palermo @rogerCopy Автор вопроса

я знаю, но тут

def get_list_of_all_works(self, url):
        artist_name = self.get_artist_name(url)
        school = self.get_school(url)

        logging.basicConfig(filename=f'{path}/{school}/{artist_name}/list_of_all_works_of_{artist_name}.log', level=logging.INFO, format=FORMAT)
        
        soup = self.get_soup(url)
        arts = soup.find_all('li', class_='painting-list-text-row')

        for link in arts:
            img = BASE_URL + link.a['href']
            title = link.text.replace(', ?', '')
            logging.info(img)

        return

строкой

logging.basicConfig(filename=f'{path}/{school}/{artist_name}/list_of_all_works_of_{artist_name}.log', level=logging.INFO, format=FORMAT)

и должен создаваться файл, который в следующем методе открывается
а self.get_list_of_all_works() не исполняется

Написано более трёх лет назад

Uno di Palermo @rogerCopy Автор вопроса

понимаю, что файла нету
я не могу понять - почему его нету, если длина списка > 1

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Как совместить два .pdf файла?
- 1 подписчик
- 21 час назад
- 134 просмотра
0

ответов
Python

+1 ещё

Простой
Не доходит колбэк в колбекобработчик, как можно решить эту проблему?
- 1 подписчик
- вчера
- 85 просмотров
1

ответ
Python

Простой
Почему AnaConda или MiniConda автоматически самоликвидируется на win10?
- 1 подписчик
- вчера
- 68 просмотров
0

ответов
Python

+1 ещё

Простой
Почему форма не по центру экрана, как исправить?
- 1 подписчик
- вчера
- 62 просмотра
0

ответов
Python

Простой
Как исправить Python error module 'win32crypt' has no attribute 'CryptProtectData' [closed]?
- 1 подписчик
- вчера
- 66 просмотров
0

ответов
Python

+1 ещё

Простой
Как торговать фьючерсами через API MEXC?
- 2 подписчика
- 19 июл.
- 375 просмотров
1

ответ
Python

+1 ещё

Простой
Есть ли кд на отправку подарков от имени бота?
- 2 подписчика
- 19 июл.
- 159 просмотров
1

ответ
Python

+2 ещё

Простой
Как сделать символьные вычислениями в питоне для поиска стационарных точек системы диффуров?
- 1 подписчик
- 16 июл.
- 200 просмотров
0

ответов
Python

+2 ещё

Простой
Telegram бот с модулем PortalsAPI, при запуске curl_cffi выдает ошибку curl: (77) что делать?
- 1 подписчик
- 15 июл.
- 199 просмотров
1

ответ
Python

Средний
Маппинг криптовалютных пар на криптобиржах?
- 1 подписчик
- 14 июл.
- 160 просмотров
1

ответ
Показать ещё Загружается…

Python разработчик

Bell Integrator • Москва

Разработчик Python

Bell Integrator • Москва

Python разработчик

Bell Integrator • Москва

Answer 1 · 2021-09-10 13:27:02

Uno di Palermo, ключевое слово "должен".
Ты напрасно выбрал logging для этой цели. Он, например, может и не создавать файл, если не было ни одной фактической записи в лог.
Вот если бы ты использовал обычный open() и писал строки сам, работало бы куда лучше.

Я уж молчу про то, что файл может не открыться

так как диск полон,
так как каталог защищён от записи,
так как path, school или artist_name содержали символы, недопустимые для использования в пути
так как какая-то другая программа удалила файл в промежутке между созданием и открытием
так как какая-то другая программа открыла в файл в исключительном режиме
и еще по куче причин

Так что ещё лучше - просто принять к сведению, что операция по открытию файла может потерпеть неудачу в любом случае. И писать программу соответственно. Блок try-catch IOError в помощь.
Кроме того, зачем пересоздавать wikiart() в цикле?

Answer 2 · 2021-09-10 12:59:41

Traceback (most recent call last):
File "G:\Desktop\py\wikiart\wikiart.py", line 285, in
w.download_images(i)
File "G:\Desktop\py\wikiart\wikiart.py", line 227, in download_images
f = open(f'{path}/{school}/{artist_name}/list_of_all_works_of_{artist_name}.log', 'r').readlines()
FileNotFoundError: [Errno 2] No such file or directory: 'G:/Desktop/py/wikiart/Экспрессионизм/Erin Hanson/list_of_all_works_of_Erin Hanson.log'

Ошибка в том, что ты пытаешься открыть файл на ЧТЕНИЕ, который не существует

Почему методы класса не работают в цикле?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт