Bs4 перестал видеть атрибут text?

Question

Banki00 @Banki00

Bs4 перестал видеть атрибут text?

Все было хорошо, скрипт нормально парсил сайт, а в очередной раз отказался работать со словами

line = pagination.text
AttributeError: 'NoneType' object has no attribute 'text'

Перезапуск не помог...

import requests
from bs4 import BeautifulSoup
import os
import csv
from datetime import datetime


start_time = datetime.now()

URL = 'https://www.avito.ru/murmanskaya_oblast/avtomobili/mitsubishi-ASgBAgICAUTgtg3ymCg?cd=1'
HEADERS = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
                         'Chrome/81.0.4044.138 Safari/537.36', 'accept': '*/*'}
HOST = 'https://www.avito.ru'
FILE = 'Cars.svc'


def get_html(url, params=None):
    r = requests.get(url, headers=HEADERS, params=params)
    return r


def get_pages_count(html):
    soup = BeautifulSoup(html, 'html.parser')
    pagination = soup.find('div', class_='pagination-root-2oCjZ')
    line = pagination.text
    p_count = int(line[-8])
    if p_count > 1:
        return p_count
    else:
        return 1


def get_content(html):
    soup = BeautifulSoup(html, 'html.parser')
    items = soup.find_all('div', class_='snippet-horizontal item item_table clearfix js-catalog-item-enum'
                                        ' item-with-contact js-item-extended')

    cars = []
    for item in items:
        cars.append({
            'Cars': item.find('a', class_='snippet-link').get_text(),
            'Settings': item.find('div', class_='specific-params specific-params_block').get_text().replace('\n ', ''),
            'Price': item.find('span', class_='snippet-price').get_text(strip=True).replace('\n ', ''),
            'City': item.find('span', class_='item-address-georeferences-item__content').get_text(),
            'Link': HOST + item.find('a', class_='snippet-link').get('href'),
        })

    return cars


def save_file(items, path):
    with open(path, 'w', newline='', encoding='UTF-8') as file:
        writer = csv.writer(file, delimiter=';')
        writer.writerow(['Авто', 'Параметры', 'Цена', 'город', 'ссылка'])
        for item in items:
            writer.writerow([item['Cars'], item['Settings'], item['Price'], item['City'], item['Link']])


def parse():
    html = get_html(URL)
    if html.status_code == 200:
        cars = []
        pages_count = get_pages_count(html.text)
        for page in range(1, pages_count):
            print(f'Парсинг старницы {page} из {pages_count}...')
            html = get_html(URL, params={"p": page})
            cars.extend(get_content(html.text))
        save_file(cars, FILE)
        print(cars)
        os.startfile(FILE)
    else:
        print('Error')


parse()
print(datetime.now() - start_time)

Вопрос задан более трёх лет назад
225 просмотров

3 комментария

Подписаться 1 Простой 3 комментария

kisaa @kisaa
pagination = soup.find('div', class_='pagination-root-2oCjZ')

А здесь точно находится то, что ищете?
Написано более трёх лет назад

Алан Гибизов @phaggi Куратор тега Python

У меня отработал скрипт без сбоев (кроме ошибки с os.startfile, т.к. это только для windows, на маке не работает.)

spoiler

Парсинг старницы 1 из 5...
Парсинг старницы 2 из 5...
Парсинг старницы 3 из 5...
Парсинг старницы 4 из 5...
...
[{'Cars': 'Mitsubishi Lancer, 2009', 'Settings': ' 130 000 км, 1.3 MT (82 л.с.), седан, передний, бензин', 'Price': '330 000  ₽', 'City': 'Кандалакша', 'Link': 'https://www.avito.ru/kandalaksha/avtomobili/mitsubishi_lancer_2009_1948709598'},

Может, ваш ip немножко забанили на сайте, чтоб не слишком парсили?

Написано более трёх лет назад

Banki00 @Banki00 Автор вопроса

Алан Гибизов, мде, в общем ничего не делая, на след. день он заработал...

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как сделать рассылку в viber в фоне?
- 1 подписчик
- вчера
- 60 просмотров
0

ответов
Python

Простой
Каким образом я могу запускать привязанных ботов в основном, что-бы основной loop не ломался и не дублировался?
- 1 подписчик
- 15 нояб.
- 211 просмотров
1

ответ
Python

Простой
Почему конвертация .py файла в .exe с помощью auto-py-to-exe происходит аномально долго и как это исправить?
- 1 подписчик
- 08 нояб.
- 247 просмотров
0

ответов
Python

+2 ещё

Простой
Как решить ошибку с отправкой почты через Outlook SMTP?
- 1 подписчик
- 08 нояб.
- 160 просмотров
0

ответов
Python

+2 ещё

Средний
Как конвертировать drawio (xml) в xml zabbix map?
- 2 подписчика
- 08 нояб.
- 135 просмотров
1

ответ
Python

Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
- 2 подписчика
- 31 окт.
- 260 просмотров
0

ответов
Python

Простой
Как сформировать изображение GS1 DataMatrix с функциональными знаками?
- 1 подписчик
- 31 окт.
- 146 просмотров
0

ответов
Python

+1 ещё

Простой
Почему callback_query_handler в telebot не работает?
- 1 подписчик
- 31 окт.
- 145 просмотров
3

ответа
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт.
- 150 просмотров
0

ответов
Python

Простой
Что делать если turtle в python не отвечает?
- 1 подписчик
- 22 окт.
- 267 просмотров
2

ответа
Показать ещё Загружается…

Python Software Engineer - ML/LLM

Ennabl • Лимассол

от 650 000 ₽

Python back-end engineer (+Kotlin)

YoloPrice

от 360 000 до 420 000 ₽

Junior Python Developer

ITK academy • Воронеж

от 75 000 ₽

pagination = soup.find('div', class_='pagination-root-2oCjZ')

А здесь точно находится то, что ищете?
У меня отработал скрипт без сбоев (кроме ошибки с os.startfile, т.к. это только для windows, на маке не работает.)

spoiler
Парсинг старницы 1 из 5... Парсинг старницы 2 из 5... Парсинг старницы 3 из 5... Парсинг старницы 4 из 5... ... [{'Cars': 'Mitsubishi Lancer, 2009', 'Settings': ' 130 000 км, 1.3 MT (82 л.с.), седан, передний, бензин', 'Price': '330 000 ₽', 'City': 'Кандалакша', 'Link': 'https://www.avito.ru/kandalaksha/avtomobili/mitsubishi_lancer_2009_1948709598'},

Может, ваш ip немножко забанили на сайте, чтоб не слишком парсили?
Алан Гибизов, мде, в общем ничего не делая, на след. день он заработал...

Bs4 перестал видеть атрибут text?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт