Парсер, парсит только первые 4 термопасты OZON. Почему?

Question

Иван Корякин @valera228822

Я такой

Парсер, парсит только первые 4 термопасты OZON. Почему?

Парсит только первые 4 элемента на каждой странице, а их там очень много.

from bs4 import BeautifulSoup
import requests
import csv
import time

HOST = 'https://www.ozon.ru/'
URL = 'https://www.ozon.ru/category/termopasta-30799/'
HEADERS = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36 Edge/18.19041'
}


def get_html(url, params = 'params'):
    r = requests.get(url, headers = HEADERS, params = params)
    return r

def get_content(html):
    soup = BeautifulSoup(html, 'html.parser')
    items = soup.find_all('div', class_='a0c6 a0d a0c9 a0c8')

    cards = []


    for item in items:
        cards.append(
            {
            'title':item.find('a', class_ = 'a2g0 tile-hover-target').get_text(),
            'komment':item.find('a', class_ = 'a2g0 tile-hover-target').get('href')
            }
        )
    print(cards)
    return cards


def parser():
    PAGENATION = input('Укажите номер: ')
    PAGENATION = int(PAGENATION.strip())
    html = get_html(URL)
    if html.status_code == 200:
        cards = []
        for page in range(1, PAGENATION + 1):
            print(f'Парсим страницу:  {page}')
            html = get_html(URL, params={'page' : page})
            cards.extend(get_content(html.text))
        pass
    else:
        print('Error')

parser()

Вопрос задан более трёх лет назад
1942 просмотра

2 комментария

Подписаться 1 Простой 2 комментария

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
Нетология

Python-разработчик с нуля

6 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

3 комментария

Иван Корякин @valera228822 Автор вопроса

Заметил, что data-v-414055a2 в коде элемента стоит первых четырёх стоит последним параметром, а в остальных первым, может это влияет)

Написано более трёх лет назад
soremix @SoreMix Куратор тега Python

Иван Корякин, никто ни на что не влияет. Код страницы откройте и найдите через ctrl+f свои термопасты, они в JSON валяются там

Написано более трёх лет назад
Иван Корякин @valera228822 Автор вопроса

SoreMix, Да они валяются тут JSON

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Как получить конкретный атрибут приложенный в обьект?
- 1 подписчик
- 28 нояб.
- 183 просмотра
1

ответ
Python

Простой
Как сохранить курсор в строке ввода при перезапуске explorer.exe?
- 1 подписчик
- 28 нояб.
- 124 просмотра
1

ответ
Python

Простой
Ошибка IndexError: string index out of range в написании реализации системы Линденмайера – от чего происходит и как исправить?
- 1 подписчик
- 27 нояб.
- 116 просмотров
1

ответ
Парсинг

Средний
Вся сложность парсинга Авито. Как это сделать правильно?
- 1 подписчик
- 26 нояб.
- 218 просмотров
1

ответ
Python

+1 ещё

Простой
Как сделать рассылку в viber в фоне?
- 1 подписчик
- 22 нояб.
- 99 просмотров
0

ответов
Telegram

+1 ещё

Простой
Как спарсить подписчиков своего телеграм канала?
- 2 подписчика
- 20 нояб.
- 467 просмотров
2

ответа
Python

Простой
Каким образом я могу запускать привязанных ботов в основном, что-бы основной loop не ломался и не дублировался?
- 1 подписчик
- 15 нояб.
- 245 просмотров
1

ответ
Веб-разработка

+1 ещё

Простой
Каким образом правильно сделать скрипт?
- 2 подписчика
- 15 нояб.
- 372 просмотра
2

ответа
Python

Простой
Почему конвертация .py файла в .exe с помощью auto-py-to-exe происходит аномально долго и как это исправить?
- 1 подписчик
- 08 нояб.
- 281 просмотр
0

ответов
Python

+2 ещё

Простой
Как решить ошибку с отправкой почты через Outlook SMTP?
- 1 подписчик
- 08 нояб.
- 177 просмотров
0

ответов
Показать ещё Загружается…

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Software Engineer - ML/LLM

Ennabl • Лимассол

от 650 000 ₽

Python back-end engineer (+Kotlin)

YoloPrice

от 360 000 до 420 000 ₽

Проверяли количество элементов в items? Предполагаю, что ошибка в выборке элементов на странице. Учитывая, что Ozon пользуется методами затруднения парсинга своих страниц, думаю, что в одну строку это сделать не получится.
AVSomov,
Да в items код заканчивается на последнем элементе как раз, не знаете как можно исправить?

Answer 1 · 2021-01-10 12:10:43

soremix @SoreMix Куратор тега Python

yellow

Потому что данные подгружаются с помощью JS.
Нажимаем CTRL+U -> ищем где же термопаста спряталась в коде

Ответ написан более трёх лет назад

3 комментария

Парсер, парсит только первые 4 термопасты OZON. Почему?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт