Почему парсер считывает всегда рандомное число обьявлений у пользователя, и как сделать так чтобы он мог нормально их считыывать?

Question

sanches303 @sanches303

Почему парсер считывает всегда рандомное число обьявлений у пользователя, и как сделать так чтобы он мог нормально их считыывать?

Есть парсер. Работает исправно до момента когда нужно считывать кол-во обьявлений у пользователя.
вот код:

import time
from selenium import webdriver
from selenium.webdriver.common.by import By
from bs4 import BeautifulSoup
link = 'https://www.list.am/ru/'
driver = webdriver.Chrome()
driver.get(link)
soup = BeautifulSoup(driver.page_source, features="lxml")
time.sleep(1)
search_text = driver.find_element(By.ID, 'idSearchBox')
search_text.send_keys('пылесос')
time.sleep(1)
search = driver.find_element(By.XPATH, '//*[@id="idSearchF"]/button')
search.click()
time.sleep(2)
secpage = driver.find_element(By.XPATH, '//*[@id="contentr"]/div[3]/div[2]/span/a[1]')
secpage.click()
time.sleep(2)
for i in range(57, 58):
    product = driver.find_element(By.XPATH, f'//*[@id="contentr"]/div[3]/a[{i}]')
    product.click()
    print(driver.window_handles)
    driver.switch_to.window(driver.window_handles[1])
    time.sleep(2)
    user = driver.find_element(By.XPATH, '//*[@id="uinfo"]/div[1]/a')
    user.click()
    print(driver.window_handles)
    time.sleep(3)
    ords = soup.find_all('div', class_='at')
    time.sleep(1)
    print(len(ords))

В чем ошибка, и как сделать так чтобы считывало все нормально?

Вопрос задан 13 нояб. 2023
60 просмотров

1 комментарий

Подписаться 1 Простой 1 комментарий

Решения вопроса 1

2 комментария

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

+1 ещё

Простой
Как пройти авторизацию на youtube с помощью selenium?
- 1 подписчик
- 25 апр.
- 72 просмотра
2

ответа
Selenium

Простой
Как проскролить страницу в право в определенном фрейме?
- 1 подписчик
- 24 апр.
- 15 просмотров
1

ответ
Java

+2 ещё

Простой
Selenide + Spring Boot. Как объявить страницу через метод open(), если класс страницы является bean?
- 1 подписчик
- 19 апр.
- 49 просмотров
0

ответов
Python

+2 ещё

Средний
Как пофиксить ошибку с сертификатом при работе с selenium?
- 1 подписчик
- 19 апр.
- 77 просмотров
1

ответ
Python

+1 ещё

Простой
Почему при использование webdriverIE все равно открывается EDge?
- 1 подписчик
- 19 апр.
- 20 просмотров
0

ответов
Python

+1 ещё

Простой
Почему не срабатывает клик по элементу при открытии станицы selenium python?
- 1 подписчик
- 16 апр.
- 61 просмотр
1

ответ
Python

+1 ещё

Простой
Как щелкнуть на show Full Screen video с помощью Selenium?
- 1 подписчик
- 13 апр.
- 48 просмотров
0

ответов
Selenium

Простой
Чем отличается автоматизирующий браузер скрипт от человека?
- 1 подписчик
- 12 апр.
- 102 просмотра
0

ответов
Python

+1 ещё

Простой
Локатор не находит элемент на сайте, хотя набран верно, пробовал разные варианты, не помогает, в чём проблема?
- 1 подписчик
- 07 апр.
- 109 просмотров
1

ответ
Python

+3 ещё

Простой
Как спарсить то что находится под br?
- 1 подписчик
- 03 апр.
- 112 просмотров
1

ответ
Показать ещё Загружается…

QA Automation Engineer

MediaSoft • Ульяновск

от 80 000 до 180 000 ₽

QA Engineer / Тестировщик ПО

Студворк

от 80 000 до 100 000 ₽

Разработчик Java (Middle/Senior)

ДИКСИ • Москва

от 150 000 до 270 000 ₽

Desktop/offline web приложение

27 апр. 2024, в 18:09

10000 руб./за проект

Скрипт для накрутки объемов на Solana (Raydium DEX)

27 апр. 2024, в 18:08

100000 руб./за проект

Разработать фронтенд для календаря дат и модуля бронирования

27 апр. 2024, в 18:01

50000 руб./за проект

Не надо ставить как можно больше тэгов. Лучше оставить один, но конкретный, с которым проблема.
См.п.3.1 Регламента. Также обратите внимание на п.3.6

Answer 1 · 2023-11-14 09:42:12

time.sleep(1)

Рекомендую использовать WebDriverWait.

soup = BeautifulSoup(driver.page_source, features="lxml")

Вы создаете объект soup вне переходов по страницам, соответственно у Вас в soup лежит html начальной страницы. Попробуйте использовать soup в цикле:

for i in range(57, 58):
    # ...
    soup = BeautifulSoup(driver.page_source, features="lxml")
    # ...

Почему парсер считывает всегда рандомное число обьявлений у пользователя, и как сделать так чтобы он мог нормально их считыывать?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт