Задать вопрос

rodion_ilnitskiy @rodion_ilnitskiy

python

Как переходить на следующюю страницу Scrapy Python?

Пытаюсь получить ссылку на продукты, переходя по категориям на сайте: m.phytopurify.com/category/1247?search=&page=3
Однако столкнулся с такой проблемой, в HTML коде кнопки, которая отправляет на следующюю страницу категории вместо ссылки это:

<button  id="btnregister"  class="ui-btn ui-shadow ui-corner-all ui-btn-icon-right ui-icon-carat-r  ui-btn-a" data-ajax="false" onclick="NextPage(3+1)">nextpage</button>

Я написал scrapy код:

import scrapy
from scrapy.spiders import CrawlSpider, Rule
from scrapy.linkextractors import LinkExtractor

class SicalSpider(CrawlSpider):
    name = 'phy'
    allowed_domains = ['phytopurify.com']
    start_urls = ['http://m.phytopurify.com/',]

    rules = (
        Rule(LinkExtractor(allow=('', ), restrict_xpaths=('//div[@class="indexnbnav"]'))),
        Rule(LinkExtractor(allow=('', ), restrict_xpaths=('//div[@class="ui-block-b"]'))), # вот именно тут, я так понимаю, есть ошибка
        Rule(LinkExtractor(allow='', restrict_xpaths=('//ul')), callback='parse_item'),
    )

    def parse_item(self, response):
            exists = response.xpath('//b[contains(text(),"CAS")]').extract_first()
            if exists:
                self.logger.info('response.url=%s' % response.url)

                item = dict()
                item['url'] = response.url
                yield item

Как в Crawlspider заставить паука перейти по кнопке?

Вопрос задан более трёх лет назад
103 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Как получить конкретный атрибут приложенный в обьект?
- 1 подписчик
- 28 нояб.
- 171 просмотр
1

ответ
Python

Простой
Как сохранить курсор в строке ввода при перезапуске explorer.exe?
- 1 подписчик
- 28 нояб.
- 118 просмотров
1

ответ
Python

Простой
Ошибка IndexError: string index out of range в написании реализации системы Линденмайера – от чего происходит и как исправить?
- 1 подписчик
- 27 нояб.
- 99 просмотров
1

ответ
Python

+1 ещё

Простой
Как сделать рассылку в viber в фоне?
- 1 подписчик
- 22 нояб.
- 98 просмотров
0

ответов
Python

Простой
Каким образом я могу запускать привязанных ботов в основном, что-бы основной loop не ломался и не дублировался?
- 1 подписчик
- 15 нояб.
- 243 просмотра
1

ответ
Python

Простой
Почему конвертация .py файла в .exe с помощью auto-py-to-exe происходит аномально долго и как это исправить?
- 1 подписчик
- 08 нояб.
- 280 просмотров
0

ответов
Python

+2 ещё

Простой
Как решить ошибку с отправкой почты через Outlook SMTP?
- 1 подписчик
- 08 нояб.
- 175 просмотров
0

ответов
Python

+2 ещё

Средний
Как конвертировать drawio (xml) в xml zabbix map?
- 2 подписчика
- 08 нояб.
- 152 просмотра
1

ответ
Python

Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
- 2 подписчика
- 31 окт.
- 275 просмотров
0

ответов
Python

Простой
Как сформировать изображение GS1 DataMatrix с функциональными знаками?
- 1 подписчик
- 31 окт.
- 157 просмотров
0

ответов
Показать ещё Загружается…

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Software Engineer - ML/LLM

Ennabl • Лимассол

от 650 000 ₽

Python back-end engineer (+Kotlin)

YoloPrice

от 360 000 до 420 000 ₽