Не понимаю, как спарсить этот товар?

Question

Daidin @Daidin

Парсинг

Не понимаю, как спарсить этот товар?

import requests
from bs4 import BeautifulSoup

URL = 'https://www.bershka.com/by/%D0%BC%D1%83%D0%B6%D1%87%D0%B8%D0%BD%D1%8B/%D0%BE%D0%B4%D0%B5%D0%B6%D0%B4%D0%B0/%D1%82%D0%BE%D0%BB%D1%81%D1%82%D0%BE%D0%B2%D0%BA%D0%B8-c1010193244.html'

HEADERS = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.93 Safari/537.36',
           'accept': '*/*'}
def get_html(url, params=None):
    r = requests.get(url, headers=HEADERS, params=params)
    return r


def get_content(html):
    soup = BeautifulSoup(html, 'html.parser')
    items = soup.find_all('p', class_='product-content')
    print(items)

def parse():
    html = get_html(URL)
    if html.status_code == 200:
        get_content(html.text)
    else:
        print("Error")

parse()

Особо ещё не разбираюсь в парсинге, поэтому ответ прошу дать простым языком)
И так есть сайт и мне надо спарсить цены, картинки и название товара, не понимаю. В коде выше я пытался спарсить хотя бы одну "карточку". Но вот что-то вообще никак не работает как уже только не пробовал. В коде как я понимаю все карточки лежат в списке ul, а каждая в li. И вот я не понимаю как такое парсить нигде инфы не могу найти)

Вопрос задан более трёх лет назад
344 просмотра

2 комментария

Подписаться 1 Простой 2 комментария

Помогут разобраться в теме Все курсы

Stepik

4в1—Парсинг, Асинхронность, Многопоточность, Многопроцессорность

2 месяца

Далее
Хекслет

Фронтенд-разработчик

10 месяцев

Далее
Stepik

FullStack Developer and Data Scientist (Python+JS+Data+CookBook)

4 месяца

Далее

Пригласить эксперта

Ответы на вопрос 1

2 комментария

ScriptKiddo @ScriptKiddo

OUT

<spoiler title="OUT">
<code>
{   'attachments': [],
    'attributes': [   {   'id': '163916354040453152',
                          'name': 'Print',
                          'type': 'PRODUCT_TAG',
                          'value': 'Принт'},
                      {   'id': '163916354040473374',
                          'name': 'Product Season V2022',
                          'type': 'XTYPEFILTER',
                          'value': 'V2022'},
                      {   'id': '163916354040468375',
                          'name': 'G-NEGRO',
                          'type': 'XCOLFILTER',
                          'value': 'Черный'},
                      {   'id': '163916354040424719',
                          'name': 'ProductType: Clothing',
                          'type': 'XTYPEFILTER',
                          'value': 'Одежда'}],
    'availabilityDate': '',
    'backSoon': '0',
    'bundleColors': [{'id': 800}],
    'bundleProductSummaries': [   {   'attachments': [],
                                      'attributes': [   {   'id': '163916354040440162',
                                                            'name': 'XMANUFACTURER',
                                                            'type': 'XMANUFACTURER',
                                                            'value': 'XMANUFACTURER'},
                                                        {   'id': '163916354040443440',
                                                            'name': 'TRIMAN',
                                                            'type': 'TRIMAN',
                                                            'value': 'TRIMAN'},
                                                        {   'id': '163916354040495116',
                                                            'name': 'XMAN_DATE',
                                                            'type': 'XMAN_DATE',
                                                            'value': 'XMAN_DATE'}],
                                      'availabilityDate': '',
                                      'backSoon': '0',
                                      'bundleColors': [],
                                      'bundleProductSummaries': [],
                                      'detail': {   'care': [   {   'description': 'МАШИННАЯ '
                                                                                   'СТИРКА '
                                                                                   'ПРИ '
                                                                                   'МАКС. '
                                                                                   '30ºC '
                                                                                   'КОРОТКИЙ '
                                                                                   'ОТЖИМ',
                                                                    'id': '7000000000000016003',
                                                                    'name': '7'},
                                                                {   'description': 'ОТБЕЛИВАТЬ '
                                                                                   'ЗАПРЕЩЕНО',
                                                                    'id': '7000000000000016001',
                                                                    'name': '14'},
                                                                {   'description': 'ГЛАДИТЬ '
                                                                                   'ПРИ '
                                                                                   'МАКС. '
                                                                                   '110ºC',
                                                                    'id': '7000000000000016004',
                                                                    'name': '18'},
  ...

</code>

</spoiler>

Написано более трёх лет назад

Daidin @Daidin Автор вопроса

Понял, спасибо.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 541 просмотр
2

ответа
Python

+2 ещё

Простой
Почему не работает Selenium?
- 1 подписчик
- 09 апр.
- 388 просмотров
2

ответа
Python

+2 ещё

Средний
Можно ли получить доступ к сайту?
- 4 подписчика
- 05 мар.
- 1091 просмотр
4

ответа
Парсинг

Простой
Как спарсить Интернет Магазин?
- 1 подписчик
- 27 февр.
- 421 просмотр
4

ответа
Веб-разработка

+1 ещё

Средний
Как на сайте с фильмами найти медиаплеер и скачать это видео через код?
- 1 подписчик
- 13 февр.
- 512 просмотров
2

ответа
Парсинг

Простой
Видит ли администрация сайта сканирование,и можно ли скрыть?
- 1 подписчик
- 07 дек. 2025
- 545 просмотров
2

ответа
Парсинг

Средний
Вся сложность парсинга Авито. Как это сделать правильно?
- 1 подписчик
- 26 нояб. 2025
- 1203 просмотра
1

ответ
Telegram

+1 ещё

Простой
Как спарсить подписчиков своего телеграм канала?
- 1 подписчик
- 20 нояб. 2025
- 866 просмотров
2

ответа
Веб-разработка

+1 ещё

Простой
Каким образом правильно сделать скрипт?
- 2 подписчика
- 15 нояб. 2025
- 499 просмотров
2

ответа
Python

+1 ещё

Сложный
Как автоматизировать работу с сайтом используя Camoufox библиотеку?
- 2 подписчика
- 14 окт. 2025
- 356 просмотров
0

ответов
Показать ещё Загружается…

с телефона, по крайней мере, не прошло такое:soup.find_all('p', class_='product-content')
может так? : soup.find_all('div', class_='product-content')
Vlad, да не, ничерта не фурычит, я уже всё перепробовал

Answer 1 · 2021-12-10 22:25:20

Информация о товарах подгружается через отдельный запрос

Вот пример

import requests
import json
import pprint

headers = {
    'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.55 Safari/537.36',
}

params = (
    ('categoryId', '1010193244'),
    ('productIds',
     '103733907,105019717,103807780,103646046,103789895,103789901,103494687,103807800,103586862,104787564,104787563,103678178,104787606,104787560,104787562,103646051,103994120,104131075,103056467,103588023,103921817,103554672,103921816,103101531,103284042,103101528,103284041,104787703,105019580,105019579,104787704,103108154,103376867,103760889,102948033,103494674,104130553,103215061,102944627,103293571'),
    ('languageId', '-20'),
)

response = requests.get('https://www.bershka.com/itxrest/3/catalog/store/45009591/40259536/productsArray',
                        headers=headers, params=params)

data = json.loads(response.text)

pp = pprint.PrettyPrinter(indent=4)
pp.pprint(data['products'][0])

Не понимаю, как спарсить этот товар?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт