Парсинг пагинация?

Question

Ivan_pmk @Ivan_pmk

Парсинг пагинация?

Всем привет, извините за тупость
https://www.ursus.ru/catalogue/zashchita_ot_padeni...
Но не могу понять как на этом сайте перебрать страницы пагинации python

<div class="wrap-pg">
    <div class="pagination">
                        <a class="show-more" href="/catalogue/zashchita_ot_padeniy_s_vysoty/page-2/?isAjax=true">показать еще</a>
          
        <div class="pagination-wr">
                            <a href="/catalogue/zashchita_ot_padeniy_s_vysoty/" class="pagination-link selected">1</a>
            
                                                            <a href="/catalogue/zashchita_ot_padeniy_s_vysoty/page-2/" class="pagination-link">2</a>
                                                                                <a href="/catalogue/zashchita_ot_padeniy_s_vysoty/page-3/" class="pagination-link">3</a>
                                                                                <a href="/catalogue/zashchita_ot_padeniy_s_vysoty/page-4/" class="pagination-link">4</a>
                 
                <a href="/catalogue/zashchita_ot_padeniy_s_vysoty/page-2/" class="pagination-link">
                    <svg class="icon-arrow" width="12" height="12">
                        <use xlink:href="/src/img/svg-sprite.svg#icon-arrow-right"></use>
                    </svg>
                </a>       
                <span class="pagination-last">8</span>
        </div>
    </div>
</div><img src="https://habrastorage.org/webt/65/7b/85/657b8507c659f527052184.png" alt="image"/>

Нужно интегрировать в код который проходится по каталогу а потом по страницам пагинации и товарам.
Вот к этому коду нужно, написать переход ко каталогу и сбор ссылок пагинации и в дальнейшем по товарам идти

url = 'https://www.ursus.ru/catalogue/'

    response = requests.get(url=url, headers=headers, cookies=cookies, proxies=proxies)
    print(response.status_code)
    soup = BeautifulSoup(response.text, "lxml")
    ctalog = soup.find_all("a", class_="categories-item")
    for category in ctalog:
        categorys = 'https://www.ursus.ru' + category.get("href")
        print(categorys)

Спасибо огромно!!!

Вопрос задан более двух лет назад
253 просмотра

2 комментария

Подписаться 1 Простой 2 комментария

Shandy @MrShandy

Код в студию

Написано более двух лет назад

Ivan_pmk @Ivan_pmk Автор вопроса

url = 'https://www.ursus.ru/catalogue/'

    response = requests.get(url=url, headers=headers, cookies=cookies, proxies=proxies)
    print(response.status_code)
    soup = BeautifulSoup(response.text, "lxml")
    ctalog = soup.find_all("a", class_="categories-item")
    for category in ctalog:
        categorys = 'https://www.ursus.ru' + category.get("href")
        print(categorys)

Вот к этому коду нужно, написать переход ко каталогу и сбор ссылок пагинации и в дальнейшем по товарам идти

Написано более двух лет назад

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ivan_pmk @Ivan_pmk Автор вопроса

url = 'https://www.ursus.ru/catalogue/'

    response = requests.get(url=url, headers=headers, cookies=cookies, proxies=proxies)
    print(response.status_code)
    soup = BeautifulSoup(response.text, "lxml")
    ctalog = soup.find_all("a", class_="categories-item")
    for category in ctalog:
        categorys = 'https://www.ursus.ru' + category.get("href")
        print(categorys)

Вот к этому коду нужно, написать переход ко каталогу и сбор ссылок пагинации и в дальнейшем по товарам идти

Написано более двух лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- 8 часов назад
- 38 просмотров
0

ответов
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 17 июл.
- 80 просмотров
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 260 просмотров
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 233 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 640 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 548 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 305 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 560 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 226 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 140 просмотров
1

ответ
Показать ещё Загружается…

url = 'https://www.ursus.ru/catalogue/' response = requests.get(url=url, headers=headers, cookies=cookies, proxies=proxies) print(response.status_code) soup = BeautifulSoup(response.text, "lxml") ctalog = soup.find_all("a", class_="categories-item") for category in ctalog: categorys = 'https://www.ursus.ru' + category.get("href") print(categorys)

Вот к этому коду нужно, написать переход ко каталогу и сбор ссылок пагинации и в дальнейшем по товарам идти

Answer 1 · 2023-12-15 10:46:34

Узнаешь сколько страниц.
и тупо перебираешь урл с page-1, page-2, page-3 ... page-8 в вашем случае

import requests

base_url = "https://www.ursus.ru/catalogue/zashchita_ot_padeniy_s_vysoty/page-"

pages = 8

for i in range(1, pages + 1):
    print(f"Page: {i}")
    print(f"{base_url}{i}/")
    requests.get(f"{base_url}{i}.")

Парсинг пагинация?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт