Как спарсить данные?

Question

iiideb @iiideb

Пишу роботов на html

Как спарсить данные?

import requests
from bs4 import BeautifulSoup as bs

headers = {'accept' : '*/*', 'user-agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.119 Safari/537.36'}
base_url = 'https://www.citilink.ru/catalog/computers_and_notebooks/parts/cpu/?available=1&status=55395790&p=0'


def find_content():
    session = requests.session()
    request = session.get(base_url, headers=headers)
    if request.status_code == 200:
        soup = bs(request.content, 'lxml')
        divs = soup.findAll('div', attrs={'class' : 'subcategory-product-item'})
        for div in divs:
            title = div.find('a', attrs={'class' : 'ddl_product_link'}).text
            href = div.find('a', attrs={'class' : 'ddl_product_link'})['href']
            about = div.find('p', attrs={'class' : 'short_description'}).text
            stand_price = div.find('span', attrs={'class' : 'subcategory-product-item__price_standart'}).text
            special_price = div.find('span', attrs={'class' : 'subcategory-product-item__price_special'}).text
            print(special_price)





find_content()

Прошу помощи. На сайте, который нужно спарсить есть с классом subcategory-product-item__price_standart и второй span с классом subcategory-product-item__price_special. В этих тэгах хранится тэг ins с одинаковым классом. Так вот, как мне спарсить данные с тэга ins, если выдает ошибку "File Path, line 19, in find_content
special_price = div.find('span', attrs={'class' : 'subcategory-product-item__price_special'}).text
AttributeError: 'NoneType' object has no attribute 'text'
Если ввести тэг ins, то спец. цена будет равна стандартной.

Вопрос задан более трёх лет назад
296 просмотров

7 комментариев

Подписаться 2 Простой 7 комментариев

iiideb @iiideb Автор вопроса

С выводом stand_price нет никаких проблем

Написано более трёх лет назад
AWEme @AWEme

iiideb, не смущает, что скидка и/или спец. цена есть не у всех товаров?

Написано более трёх лет назад
alex-1917 @alex-1917

почему ситилинк?

Написано более трёх лет назад
iiideb @iiideb Автор вопроса

alex-1917, почему alex?

Написано более трёх лет назад
alex-1917 @alex-1917

iiideb,
имелось ввиду, что если оторвать ленивый зад от стильно-модно-молодежно-пайтон и чутка погуглить, то внезапно уже кто-то качественно напарсил этот сити и есть общедоступные ежедневные результаты.
ну а вы и дальше продолжайте молотить клаву.

Написано более трёх лет назад
iiideb @iiideb Автор вопроса

alex-1917, а смысл тогда учиться программированию, если уже кто то программирует

Написано более трёх лет назад
alex-1917 @alex-1917

iiideb, в тексте вашего вопроса об этом ни слова.
секундочку.....
....
...
да, и среди тегов не нашел...
....
учиться - да , ок.

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- 10 часов назад
- 40 просмотров
1

ответ
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 17 июл.
- 80 просмотров
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 261 просмотр
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 233 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 640 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 548 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 306 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 560 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 226 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 140 просмотров
1

ответ
Показать ещё Загружается…

С выводом stand_price нет никаких проблем
iiideb, не смущает, что скидка и/или спец. цена есть не у всех товаров?
iiideb,
имелось ввиду, что если оторвать ленивый зад от стильно-модно-молодежно-пайтон и чутка погуглить, то внезапно уже кто-то качественно напарсил этот сити и есть общедоступные ежедневные результаты.
ну а вы и дальше продолжайте молотить клаву.
alex-1917, а смысл тогда учиться программированию, если уже кто то программирует
iiideb, в тексте вашего вопроса об этом ни слова.
секундочку.....
....
...
да, и среди тегов не нашел...
....
учиться - да , ок.

Answer 1 · 2019-03-05 01:51:38

special_price = div.find('span', attrs={'class' : 'subcategory-product-item__price_special'}).text
AttributeError: 'NoneType' object has no attribute 'text'

А что если div.find не находит эту строку в принципе(т.е. в div в котором проходит поиск её просто нет)?
Можно сделать, например так:

def safe_search(tag, attrs):
    x = div.find('span', attrs={'class' : 'subcategory-product-item__price_special'})
    if x is not None:
        return x.text()
    else:
        return ''

Как спарсить данные?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт