Как достать ссылки на страницы при парсинге?

Question

Alenwar @Alenwar

От глупыша до мастера

Как достать ссылки на страницы при парсинге?

Добрый день. При парсинге сайта https://www.olx.pl/elektronika/komputery/laptopy/ вылезает ошбика, что нет ссылки на атрибуты, NoneType

def get_url_card():
    for page_number in range(1, 3):
        sleep(2)
        url_page = f'{base_url}?page={page_number}'
        response = requests.get(url_page, headers=headers)
        page_soup = BeautifulSoup(response, "lxml")
        data_page = page_soup.find_all("div", class_="css-1sw7q4x")

        for card in data_page:
            url_card = "https://www.olx.pl" + card.find("a", class_="css-rc5s2u").a.get("href")
            yield url_card

Ответ с сайта всегда 200
Вот ссылка в коде сайта:

<a class="css-rc5s2u" href="/d/oferta/laptop-dell-latitude-e7470-i5-6300u-256sd-8gb-fhd-CID99-IDKLqHP.html">

В чем ошибка и как её решить?

Вопрос задан более года назад
137 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Python-разработчик

8 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Чтобы сделать несколько запросов к OpenAI серверу из Python, нужно каждый раз вызывать client.chat.completions.create?
- 1 подписчик
- вчера
- 74 просмотра
2

ответа
Python

Простой
Какой отлдачик для Python поставить новичку?
- 1 подписчик
- 20 дек.
- 114 просмотров
2

ответа
Python

Простой
Существует ли менеджер виртуальных окружений для python, который хранит все пакеты в одном месте?
- 3 подписчика
- 18 дек.
- 186 просмотров
1

ответ
Python

Простой
Почему не работает await event.message.delete()?
- 1 подписчик
- 16 дек.
- 217 просмотров
1

ответ
Python

Простой
Почему при установке iJulia у меня возникает ошибка, указывающая на отсутствие Conda?
- 1 подписчик
- 16 дек.
- 75 просмотров
0

ответов
Python

Простой
Почему выходит ошибка?
- 1 подписчик
- 15 дек.
- 197 просмотров
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 226 просмотров
1

ответ
Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 09 дек.
- 141 просмотр
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 08 дек.
- 246 просмотров
0

ответов
Парсинг

Простой
Видит ли администрация сайта сканирование,и можно ли скрыть?
- 1 подписчик
- 07 дек.
- 400 просмотров
2

ответа
Показать ещё Загружается…

Специалист по API и автоматизации данных (Google Apps Script / Python)

Агентство ШОЛЬЧЕВ

До 100 000 ₽

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Backend Developer

Hard Bootstrapping LLC. • Санкт-Петербург

от 175 000 до 350 000 ₽

Answer 1 · 2024-02-27 18:24:56

Вот ссылка в коде сайта:

Как проверял, что она в коде сайта? Небось через браузер?

Правило первое: при ошибке записывай в файл то, что тебе прислал сервер, для последущего анализа. Может, сервер понял, что твой бот - это бот, и там "уходи, противный" вместо ожидаемой тобой страницы. А может, там динамический сайт, с контентом, подгружаемым через JS.

Answer 2 · 2024-02-28 00:32:16

fergoru @fergoru

.a.get("href")

Что собственно делает '.а' перед вызовом метода '.get'?

Ответ написан более года назад

Комментировать

Как достать ссылки на страницы при парсинге?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт