Как парсить сайт который подгружает информации позже?

Question

Александр Коваленко @KovalenkoA12

Как парсить сайт который подгружает информации позже?

Всем привет нужно парсить сайт https://znanija.com/ , чтобы при любом вопросе он в ответ отправлял количество результатов и варианты ответов, но проблема в том что при переходе на сайт происходить прогрузка и чтобы получать информацию нужна задержка чтобы сайт прогрузился

import requests
from bs4 import BeautifulSoup
from time import sleep

URL = 'https://znanija.com/app/ask?entry=hero&q=%D0%BE%D0%B1%D1%8C%D0%B5%D0%BC+%D0%BA%D1%83%D0%B1%D0%B0'
header = {'user-agent':
              'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.190 Safari/537.36'}
sleep(2)
page = requests.get(URL, headers=header)
soup = BeautifulSoup(page.content, 'html.parser')
req = soup.find('span', {'class':'sg-text'})
print(req)

результат

<span class="sg-text">
Поиск...
</span>

Вопрос задан более трёх лет назад
317 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

6 комментариев

MinTnt @MinTnt

Знаешь, классно вот спустя много времени снова видеть подобный ответ. Считай благодаря твоему ответу на мой идентичный вопрос, я начал понимать, как всё устроено в сети и тд

Написано более трёх лет назад
Александр Коваленко @KovalenkoA12 Автор вопроса

Так мне нужно получить данные, а не отправить или я не правильно понял?

Написано более трёх лет назад
soremix @SoreMix Куратор тега Python

KovalenkoA12, отправляете этот запрос, в ответ на него приходят посты

Написано более трёх лет назад
MinTnt @MinTnt

KovalenkoA12, ну вот нашёл другой мой ответ с инструкцией, для парсинга к примеру информации от скрипта Как вывести код с браузерным расширением?

Написано более трёх лет назад
soremix @SoreMix Куратор тега Python

MinTnt, и пост и гет умеют в передачу данных, просто в пост методе это специальное поле с пост-датой, которое поддерживает разные виды, application/x-www-form-urlencoded, application/json, multipart/form-data и др. Ну и пост соответственно не упирается в ограничение по URL, который можно получить если слать парааметры гетом. Ну а так да, это более правильная форма взаимодействия с сервером с динамическими данными

Написано более трёх лет назад
MinTnt @MinTnt

KovalenkoA12, о кста, советую скачать Fiddler, разобравшись в нём, прикольная программка, можно как смотреть получаемые запросы, так и повторять, с изменениями каких-то данных, и смотреть эффект

Написано более трёх лет назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Сложный
Как решить задачу на 3D DP?
- 1 подписчик
- 22 июл.
- 145 просмотров
2

ответа
Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- 19 июл.
- 98 просмотров
1

ответ
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 17 июл.
- 111 просмотров
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 372 просмотра
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 242 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 680 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 556 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 310 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 578 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 230 просмотров
2

ответа
Показать ещё Загружается…

Answer 1 · 2021-02-27 23:18:24

нужна задержка чтобы сайт прогрузился

Это не так работает. Данные загружаются динамически с помощью дополнительных фоновых запросов.
Открываете инструменты разработчика, вкладку нетворк и ищите нужный вам запрос в XHR. Затем повторяете его через python
Спойлер: вот он

POST на https://znanija.com/graphql/ru

Как парсить сайт который подгружает информации позже?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт