Как парсить сайт с разными правилами для паука?

Question

rodion_ilnitskiy @rodion_ilnitskiy

Scrapy

Как парсить сайт с разными правилами для паука?

Я разделил паука от краулера. Мне необходимо достать некоторые данные с сайта с помощью Python Scrapy, используя разные условия для поучния результатов. Итак, у меня есть функции в одном файле:

#
    def parse(self, response):
        xpath = '//div[@class="proinfor"]//div[@class="prolist_casinforimg"]/a/@href'
        urls = response.xpath(xpath).extract()
        for url in urls:
            url = url.replace("//", "", 1)
            yield scrapy.Request(response.urljoin(url),
                                 callback=self.parse_requem)
            yield scrapy.Request(response.urljoin(url),
                                 callback=self.parse_obj)

    def parse_requem(self, response):
        ...
        yield scrapy.Request(callback=self.parse_item)

    def parse_item(self, response):
        parser = BaseParser(response)
        return parser.construct_item()

    def parse_obj(self, response):
        parser = BaseParser(response)
        return parser.construct()

И код в классе BaseParser:

#
    def parse_price(self):
        Price = response.body
        return Price

    def parse_ex(self):
        exists = self.xpath('//text()').extract_first()
        return exists

    def construct(self):
        item = dict()
        item['ex'] = self.parse_ex()
        return item

    def construct_item(self):
        item = dict()
        item['price'] = self.parse_price()
        return item

Как вы видите, я пытаюсь разделить логику получения данных, однако вместо этого я получаю только результат исполнения от одной функции.
Как разделить логику парсинга для паука?

Вопрос задан более трёх лет назад
146 просмотров

2 комментария

Подписаться 1 Простой 2 комментария

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Telegram

+1 ещё

Простой
Можно ли скрапить телеграмм?
- 1 подписчик
- 05 нояб. 2024
- 371 просмотр
1

ответ
Парсинг

+1 ещё

Простой
Как найти источник данных этого сайта?
- 1 подписчик
- более года назад
- 257 просмотров
1

ответ
HTML

+2 ещё

Простой
Как вытянуть значение из парсера на c#?
- 1 подписчик
- более года назад
- 166 просмотров
1

ответ
Scrapy

Средний
Как сделать так чтобы в scrapy, парсились дубликаты ссылок? То есть так чтобы каждая спаршенная ссылка, должна создать уникальный файл. Как?
- 1 подписчик
- более двух лет назад
- 116 просмотров
1

ответ
Python

+1 ещё

Простой
Как в Scrapy сохранить результат в JSON при запуске из скрипта?
- 1 подписчик
- более двух лет назад
- 150 просмотров
1

ответ
Scrapy

Простой
Как обратиться к элементу sitemap.xml через Scrapy?
- 1 подписчик
- более двух лет назад
- 39 просмотров
0

ответов
Scrapy

Простой
Почему Scrapy не сохраняет результат?
- 1 подписчик
- более двух лет назад
- 53 просмотра
0

ответов
Scrapy

Простой
Как использовать несколько методов в scrapy?
- 1 подписчик
- более двух лет назад
- 91 просмотр
0

ответов
Scrapy

Простой
Почему при парсинге Озона выдает только первые 4 значения?
- 1 подписчик
- более двух лет назад
- 295 просмотров
0

ответов
WordPress

+2 ещё

Простой
Не загружается файл импорта WooCommerce?
- 1 подписчик
- более трёх лет назад
- 78 просмотров
0

ответов
Показать ещё Загружается…

Fullstack разработчик (TypeScript+React). Свободный график. Фулл тайм.

Круглый Квадрат

от 350 000 до 450 000 ₽

Разработчик WebRTC-сервисов на Go в видеоплатформу

Яндекс • Москва

от 300 000 до 490 000 ₽

PHP разработчик

IT-hunter

До 6 500 $

Как вы видите, я пытаюсь разделить логику получения данных, однако вместо этого я получаю только результат исполнения от одной функции.

тут хорошо бы конкретизировать
нифига не понятно от какой одной функции

Как парсить сайт с разными правилами для паука?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт