Как достать данные со страницы, используя scrapy?

Question

Jumper1 @Jumper1

Как достать данные со страницы, используя scrapy?

Задача состоит в том, чтобы спарсить карточку, затем перейти по ссылке в карточке и еще оттуда достать неодходимые данные, но так, чтобы это выводилось вместе.
Сейчас у меня получается только раздельно вывести и, по всей видимости, в разноброс.
Пробовал объединять в переменную, но выводило ошибку
По-разному уже извращался, но без результата
Что можно попробовать сделать? И возможно ли такое вообще?)

class TutorSpider(scrapy.Spider):
    name = 'tutorial'
    start_urls = [
        'https://hh.ru/search/vacancy?L_is_autosearch=false&area=3&clusters=true&enable_snippets=true&text=Python&page=0',
    ]

    def parse(self, response: HtmlResponse):
        """vacancy_href = response.xpath('//a[@class="bloko-link HH-LinkModifier"]/@href')
        for href in vacancy_href:
            yield response.follow(href, callback=self.parse_vacancy)"""

        # Переходит по страницам
        next_page = response.xpath('//a[@class="bloko-button HH-Pager-Controls-Next HH-Pager-Control"]')
        for page in next_page:
            yield response.follow(page, callback=self.parse)

        # Парсит карточку с вакансией
        for card_vacancy in response.xpath('//div[@class="vacancy-serp-item "]'):
            yield {'title': card_vacancy.xpath('.//a[@class="bloko-link HH-LinkModifier"]/text()').get(),
                'salary': card_vacancy.xpath('.//span[@class="bloko-section-header-3 bloko-section-header-3_lite"]/text()').get(),
                'employer': card_vacancy.xpath('.//a[@class="bloko-link bloko-link_secondary"]/text()').get(),
                }

        # Парсит страницу с тегами и адресом
        for page_with_details in response.xpath('//a[@class="bloko-link HH-LinkModifier"]'):
            yield response.follow(page_with_details, self.parse_vacancy_details)


    def parse_vacancy_details(self, response: HtmlResponse):
        yield {'place': response.xpath('//span[@data-qa="vacancy-view-raw-address"]/text()').get(),
               'tags': response.xpath('//span[@data-qa="bloko-tag__text"]/text()').getall(),
                'url': response.url,
                }

Вопрос задан более трёх лет назад
354 просмотра

Комментировать

Подписаться 2 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 214 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 569 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 501 просмотр
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 286 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 514 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 216 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 126 просмотров
1

ответ
Python

Простой
Как отправить видео в мессенджер MAX с прогрессом загрузки Python (tqdm)?
- 2 подписчика
- 30 мая
- 332 просмотра
1

ответ
Python

Простой
Стоит ли переходить на IDE?
- 1 подписчик
- 25 мая
- 666 просмотров
5

ответов
Python

+2 ещё

Простой
Где хранить сессию SQLAlchemy в FastAPI: в конструкторе сервиса или передавать в каждый метод?
- 2 подписчика
- 23 мая
- 347 просмотров
1

ответ
Показать ещё Загружается…

Как достать данные со страницы, используя scrapy?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт