Как при помощи BeautifulSoup распарсить элементы?

Question

driveknight @driveknight

Как при помощи BeautifulSoup распарсить элементы?

Здравствуйте. Вот часть моего парсера которая получает цены:

def get_soup(lp: list):
    for i in lp:
        with open('html.txt', 'w', encoding='utf-8') as f:
            response = requests.get(i, headers=headers, cookies=cookies)
            f.write(response.text)
            with open("html.txt", encoding='utf-8') as nf:
                soup = BeautifulSoup(nf, 'html.parser')
                tags = soup.find(lambda tag: tag.name == 'div' and tag.get('class') == ['n_6'])

                for prices in tags.find_all('span', class_='N_1'):
                    price_re = re.sub(r'\D', '', *prices)
                    price.append(price_re)
                
                for p_prices in tags.find_all('p', class_='N_'):
                    p_price_re = re.sub(r'\D', '', *p_prices)
                    p_price.append(p_price_re)

Отсюда:

<div class="NZ N_2"><p class="N_">3 149&nbsp;₽</p><p class="N_0"><span class="N_1">4 999&nbsp;₽</span></p></div>

Проблема в том, что когда попадаются товары без промо цены, то все цены с этого товары начинают записываться некорректно. Промо цены если что записываются верно. Я вроде понимаю из-за чего эта ошибка, но не получается ее обработать или написать проверку. С операторами in и is не получается так как страница парсится целиком. Парсить каждый товар отдельно единственный выход? Хотелось бы реализовать это именно с BeautifulSoup

Вопрос задан более трёх лет назад
138 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- вчера
- 69 просмотров
1

ответ
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 17 июл.
- 86 просмотров
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 290 просмотров
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 233 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 647 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 550 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 307 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 563 просмотра
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 227 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 140 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2021-11-10 07:44:21

Полагаю, вместо записи цен в список лучше организовать словарь, в котором под нумерованные ключи писать нормальные цены, а в ключ “promo” писать промо-цену.

Как при помощи BeautifulSoup распарсить элементы?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт