Как парсить количество объявлений у продавца на олх?

Question

Александр Коваленко @KovalenkoA12

Как парсить количество объявлений у продавца на олх?

Задача в том чтобы парсить страницы поиска олх, получать названия товара - цену, парсить объявления и получать ссылки на профили продавцов и по ссылке продавцов парсить количество объявлений

from bs4 import BeautifulSoup
import requests

URL = 'https://www.olx.pt/tecnologia-e-informatica/'
HEADERS = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Safari/537.36'
}

offer = []
user_link = []
offer_in_user = []


def parse():
    response = requests.get(URL, headers=HEADERS)
    soup = BeautifulSoup(response.content, 'html.parser')
    # получаем все "офферы" на странице
    items = soup.findAll('div', class_='offer-wrapper')
    #

    for item in items:
        # исключаем обьявления которые с олх доставкой
        olx_ship = item.find('span', class_='promo-label promo-label--ctt inlblk rel')
        if olx_ship:
            pass
        else:
            try:

                title = item.find('a', class_='marginright5 link linkWithHash detailsLink').get_text(
                    strip=True)  # запись названия
                price = item.find('p', class_='price').get_text(strip=True)  # запись  цены
                link = item.find('a', class_='marginright5 link linkWithHash detailsLink').get('href')  # запись ссылки
                city = item.find('small', class_='breadcrumb x-normal').find_next('span').get_text(
                    strip=True)  # запись города
                comps = {
                    'title': title,
                    'price': price,
                    'link': link,
                    'city': city,
                }
                offer.append(comps)
            except:
                pass
    # получение ссылок на пользователя
    for user in offer:
        r = requests.get(user['link'], headers=HEADERS)
        soup = BeautifulSoup(r.text, 'html.parser')

        try:
            # ищем ссылку на профиль
            userx = soup.find('a', class_='userbox__image-link').get('href')
            users = {
                'user': userx
            }
            user_link.append(users)
        except:
            users = {
                'user': ''
            }
            user_link.append(users)


parse()

вот код который парсит все это кроме, количества объявлений продавца, при парсинге оно либо выдает ошибку (наверное много запросов с одного ip) или выдает количеств объявлений в сумме со всех продавцов, а не отдельно каждого

Вопрос задан более трёх лет назад
196 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillfactory

Профессия Python-разработчик

9 месяцев

Далее
Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Простой
Что делать если turtle в python не отвечает?
- 1 подписчик
- 22 окт.
- 153 просмотра
2

ответа
Python

Простой
Не могу разобраться почему не работает код python?
- 1 подписчик
- 22 окт.
- 268 просмотров
1

ответ
Python

Простой
Какие есть удобные API для генерации картинок через AI?
- 2 подписчика
- 20 окт.
- 176 просмотров
1

ответ
Python

Простой
Дублирование логов в python logging?
- 3 подписчика
- 19 окт.
- 261 просмотр
1

ответ
Python

+1 ещё

Средний
Как сделать чтоб аккаунт писал при подписке на канал?
- 1 подписчик
- 16 окт.
- 162 просмотра
0

ответов
Python

+1 ещё

Простой
Какие есть простые легковесные LLM для локального использования?
- 2 подписчика
- 14 окт.
- 614 просмотров
2

ответа
Python

+1 ещё

Сложный
Как автоматизировать работу с сайтом используя Camoufox библиотеку?
- 2 подписчика
- 14 окт.
- 135 просмотров
0

ответов
Python

+1 ещё

Простой
FastAPI Prometheus_fastapi_instrumentator где мне следует разместить?
- 1 подписчик
- 09 окт.
- 149 просмотров
1

ответ
Python

+1 ещё

Простой
Пытаюсь пропустить число 10 двумя способами.(правильный второй код) Почему эти два кода дают разный результат?
- 1 подписчик
- 09 окт.
- 565 просмотров
2

ответа
Python

+2 ещё

Простой
В каком слое DTO объект преобразовывать в словарь перед сохранением в БД?
- 1 подписчик
- 08 окт.
- 150 просмотров
2

ответа
Показать ещё Загружается…

Python Developer

Strikt

от 100 000 до 150 000 ₽

Backend Python Developer Middle/Senior

AppRoute

До 3 000 $

Python разработчик

ITK academy • Казань

от 75 000 ₽

Как парсить количество объявлений у продавца на олх?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт