Парсер на Selenium почему то получает не все элементы?

Question

Александр Коваленко @KovalenkoA12

Парсер на Selenium почему то получает не все элементы?

Проблема в том что нужно получать все ссылки на объявления, а он получает ссылки только на первые 2 объявления и дублирует ссылки почему

from selenium import webdriver
from time import sleep
base_link = 'https://www.milanuncios.com/moda-mujer/?vendedor=part&orden=relevance&fromSearch='

class MilanunciosParser(object):
    def __init__(self, driver):
        self.driver = driver  

    def parse(self):
        self.page()  

    def page(self):
        self.driver.get(base_link) 

        main_div = self.driver.find_elements_by_class_name('ma-AdCard-titleLink')  

        for url in main_div:  
            print(url.get_attribute('href'))

def main():
    driver = webdriver.Chrome()
    parser = MilanunciosParser(driver)
    parser.parse()


if __name__ == '__main__':
    main()

Вывод:

https://www.milanuncios.com/abrigos-y-chaquetas/ultimo-dia-de-la-gran-oferta-394525989.htm
https://www.milanuncios.com/abrigos-y-chaquetas/ultimo-dia-de-la-gran-oferta-394525989.htm
https://www.milanuncios.com/jerseys-mujer/jersey-lana-negro-aplicaciones-386796487.htm
https://www.milanuncios.com/jerseys-mujer/jersey-lana-negro-aplicaciones-386796487.htm

Вопрос задан более трёх лет назад
185 просмотров

1 комментарий

Подписаться 1 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

4 комментария

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- вчера
- 71 просмотр
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 239 просмотров
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 229 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 632 просмотра
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 545 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 305 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 557 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 226 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 140 просмотров
1

ответ
Python

Простой
Как отправить видео в мессенджер MAX с прогрессом загрузки Python (tqdm)?
- 2 подписчика
- 30 мая
- 339 просмотров
1

ответ
Показать ещё Загружается…

страница не успевает сгенерировать больше к тому моменту когда выполняется код

поставьте ожидание пока прийдет скажем 20 элементов
их и будет как минимум 20

Answer 1 · 2021-04-09 23:23:28

Это не ошибка парсера, это такая страница, там действительно два одинаковых класса. Придется дописать скрипт, который будет проверять список и удалять дубликаты

Парсер на Selenium почему то получает не все элементы?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт