Задать вопрос

rodion_ilnitskiy @rodion_ilnitskiy

scrapy

Scrapy

Как парсить сайт с разными правилами для паука?

Я разделил паука от краулера. Мне необходимо достать некоторые данные с сайта с помощью Python Scrapy, используя разные условия для поучния результатов. Итак, у меня есть функции в одном файле:

#
    def parse(self, response):
        xpath = '//div[@class="proinfor"]//div[@class="prolist_casinforimg"]/a/@href'
        urls = response.xpath(xpath).extract()
        for url in urls:
            url = url.replace("//", "", 1)
            yield scrapy.Request(response.urljoin(url),
                                 callback=self.parse_requem)
            yield scrapy.Request(response.urljoin(url),
                                 callback=self.parse_obj)

    def parse_requem(self, response):
        ...
        yield scrapy.Request(callback=self.parse_item)

    def parse_item(self, response):
        parser = BaseParser(response)
        return parser.construct_item()

    def parse_obj(self, response):
        parser = BaseParser(response)
        return parser.construct()

И код в классе BaseParser:

#
    def parse_price(self):
        Price = response.body
        return Price

    def parse_ex(self):
        exists = self.xpath('//text()').extract_first()
        return exists

    def construct(self):
        item = dict()
        item['ex'] = self.parse_ex()
        return item

    def construct_item(self):
        item = dict()
        item['price'] = self.parse_price()
        return item

Как вы видите, я пытаюсь разделить логику получения данных, однако вместо этого я получаю только результат исполнения от одной функции.
Как разделить логику парсинга для паука?

Вопрос задан более двух лет назад
144 просмотра

2 комментария

Подписаться 1 Простой 2 комментария

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Telegram

+1 ещё

Простой
Можно ли скрапить телеграмм?
- 1 подписчик
- 05 нояб. 2024
- 314 просмотров
1

ответ
Парсинг

+1 ещё

Простой
Как найти источник данных этого сайта?
- 1 подписчик
- 30 июн. 2024
- 200 просмотров
1

ответ
HTML

+2 ещё

Простой
Как вытянуть значение из парсера на c#?
- 1 подписчик
- 08 февр. 2024
- 158 просмотров
1

ответ
Scrapy

Средний
Как сделать так чтобы в scrapy, парсились дубликаты ссылок? То есть так чтобы каждая спаршенная ссылка, должна создать уникальный файл. Как?
- 1 подписчик
- более года назад
- 108 просмотров
1

ответ
Python

+1 ещё

Простой
Как в Scrapy сохранить результат в JSON при запуске из скрипта?
- 1 подписчик
- более двух лет назад
- 145 просмотров
1

ответ
Scrapy

Простой
Как обратиться к элементу sitemap.xml через Scrapy?
- 1 подписчик
- более двух лет назад
- 36 просмотров
0

ответов
Scrapy

Простой
Почему Scrapy не сохраняет результат?
- 1 подписчик
- более двух лет назад
- 52 просмотра
0

ответов
Scrapy

Простой
Как использовать несколько методов в scrapy?
- 1 подписчик
- более двух лет назад
- 85 просмотров
0

ответов
Scrapy

Простой
Почему при парсинге Озона выдает только первые 4 значения?
- 1 подписчик
- более двух лет назад
- 267 просмотров
0

ответов
WordPress

+2 ещё

Простой
Не загружается файл импорта WooCommerce?
- 1 подписчик
- более двух лет назад
- 66 просмотров
0

ответов
Показать ещё Загружается…

Автотестировщик / Middle-Senior Java Automation QA Engineer

Bell Integrator • Москва

До 260 000 ₽

Senior DevOps Engineer

5POST • Москва

от 350 000 ₽

Монтажник интернет-сетей (инсталлятор)

beeline • Москва

До 168 000 ₽

Разработайте скрипт (Python, PHP или Node.js)

15 янв. 2025, в 10:46

5000 руб./за проект

Разработка сайта с виртуальным туром

15 янв. 2025, в 10:26

120000 руб./за проект

Доработка сайта посвященного астрологи (с зодиакальным "колесом")

15 янв. 2025, в 09:36

200000 руб./за проект