Нужно спарсить номера телефонов, но они появляются полсе нажатии на кнопку, как их спарсить?

Question

phpmadara @Mansurkolonki

Нужно спарсить номера телефонов, но они появляются полсе нажатии на кнопку, как их спарсить?

import requests
from bs4 import BeautifulSoup
import lxml
import json
num_of_page = 1

for i in range(num_of_page):
    url = 'https://blizko.ru/gde_kupit_kvartiru/agentstva_nedvizhimosti?page=' + str(i + 1)
    response = requests.get(url)
    soup = BeautifulSoup(response.text, 'lxml')
    bio = soup.find_all('p', class_='cli-description')
    name = soup.find_all('a', class_='cli-title js-cli-title js-ykr-action')
    number = soup.find_all('span', class_='"phone-')
    for i in range(0, len(bio)):
        print(bio[i].text)
        print('--' + name[i].text)
urr = 'https://blizko.ru/phones?company=13528112&count=3&hit_visits_statistics=true'
phone = requests.get(urr).json()
print(phone)

Вот такой код, статичные данные я уже вывел. но вот номер телефона....

Вопрос задан более трёх лет назад
411 просмотров

Комментировать

Подписаться 2 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
ProductStar

Профессия: Python-разработчик

8 месяцев

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Чтобы сделать несколько запросов к OpenAI серверу из Python, нужно каждый раз вызывать client.chat.completions.create?
- 1 подписчик
- вчера
- 75 просмотров
2

ответа
Python

Простой
Какой отлдачик для Python поставить новичку?
- 1 подписчик
- 20 дек.
- 117 просмотров
2

ответа
Python

Простой
Существует ли менеджер виртуальных окружений для python, который хранит все пакеты в одном месте?
- 3 подписчика
- 18 дек.
- 187 просмотров
1

ответ
Python

Простой
Почему не работает await event.message.delete()?
- 1 подписчик
- 16 дек.
- 218 просмотров
1

ответ
Python

Простой
Почему при установке iJulia у меня возникает ошибка, указывающая на отсутствие Conda?
- 1 подписчик
- 16 дек.
- 75 просмотров
0

ответов
Python

Простой
Почему выходит ошибка?
- 1 подписчик
- 15 дек.
- 198 просмотров
2

ответа
Python

+1 ещё

Средний
Разработка самообучающегося бота. Как лучше настроить экранное зрение?
- 2 подписчика
- 14 дек.
- 228 просмотров
1

ответ
Python

+2 ещё

Простой
Как получить доступ к элементам внутри shadow-root (closed)?
- 1 подписчик
- 09 дек.
- 141 просмотр
1

ответ
Python

+1 ещё

Простой
Как повысить читабельность кода?
- 1 подписчик
- 08 дек.
- 247 просмотров
0

ответов
Парсинг

Простой
Видит ли администрация сайта сканирование,и можно ли скрыть?
- 1 подписчик
- 07 дек.
- 400 просмотров
2

ответа
Показать ещё Загружается…

Специалист по API и автоматизации данных (Google Apps Script / Python)

Агентство ШОЛЬЧЕВ

До 100 000 ₽

Python Developer

Strikt

от 100 000 до 150 000 ₽

Python Backend Developer

Hard Bootstrapping LLC. • Санкт-Петербург

от 175 000 до 350 000 ₽

Answer 1 · 2022-08-23 15:32:48

from selenium import webdriver
import selenium
import time

driver=webdriver.Chrome('C:\\inst\\chromedriver_win32\\chromedriver.exe')
page2='https://____.ru/gde_kupit_kvartiru/agentstva_nedvizhimosti?page=1'

driver.get(page2)
time.sleep(3)
driver.find_element(selenium.webdriver.common.by.By.XPATH,
                    f'//*[@class="show-"]').click()
time.sleep(4) #я задержку ставил на всякий случай, возможно, сработает и без неё, если там совсем никто с парсерами не борется
try:
    a=driver.find_element(selenium.webdriver.common.by.By.XPATH,
                    f'//li[contains(@class, "phone-")]').text
    print ('a=', a)
except Exception:
    print (Exception)
try:
    b=driver.find_element(selenium.webdriver.common.by.By.XPATH,
                    f'//a[contains(@href, "tel:+")]').text
    print ('b=', b)
except Exception:
    print (Exception)

C:\Python36\python.exe C:/py/selen1.py
a= +7 (926) 626-28-66
b= +7 (926) 626-28-66

Возможно, имея список фирм с их id типа ".../phones?company=14402101" можно по этим номерам перебрать
Еще имхо надо потом удалить из вопроса url сайта а то вдруг найдут и поставят защиту, хотя сайт явно не такой продвинутый в этом плане как крупные.

Answer 2 · 2022-08-23 15:08:49

а) разобраться, как сайт получает номер телефона, и повторить. Если номер подгружается отдельным запросом, выяснить каким, попробовать сделать запрос самому. Если номер спрятан в теле страницы, выяснить где, как он зашифрован, извлечь. расшифровать. Муторно, но требует меньше ресурсов.
б) вместо requests использовать безголовый браузер (selenium), имитировать клик на кнопку, пусть сайт сам всё за нас сделает. Легче, но такие вещи прожорливы по памяти и CPU.

Нужно спарсить номера телефонов, но они появляются полсе нажатии на кнопку, как их спарсить?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт