Задержка для парсера сайта?

Question

Be3yxa @Be3yxa

Задержка для парсера сайта?

Добрый день, появилась такая проблема, сайт - https://www.coinglass.com/pro/cme/cftc раньше не подгружал данные(сразу значения были на сайте), а с недавних пор начал и если обновить страницу, можно заметить что первую секунду все значения на странице равны 0. А библиотека BS4 парсит эти нули. Есть ли какая то возможность сделать задержку? Чтобы сначала страница прогрузилась, а потом парсилась.

Новичок в программировании, пытался сделать таймер перед requests.get, не помогло.

html = requests.get(URL, headers=HEADERS)
            time.sleep(3)
            soup = BeautifulSoup(html.text, 'lxml')
            long_inst = soup.find_all('table', class_='code133741')[+1].find_all('td')[+25].text
            long_inst_changes = soup.find_all('table', class_='code133741')[+1].find_all('td')[+42].text
            short_inst = soup.find_all('table', class_='code133741')[+1].find_all('td')[+26].text
            short_inst_changes = soup.find_all('table', class_='code133741')[+1].find_all('td')[+43].text
            long_funds = soup.find_all('table', class_='code133741')[+1].find_all('td')[+28].text
            long_funds_changes = soup.find_all('table', class_='code133741')[+1].find_all('td')[+45].text
            short_funds = soup.find_all('table', class_='code133741')[+1].find_all('td')[+29].text
            short_funds_changes = soup.find_all('table', class_='code133741')[+1].find_all('td')[+46].text
            date = soup.find('div', class_='bybt-box').find('div').text[6:]

Вопрос задан более трёх лет назад
857 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Telegram

+1 ещё

Простой
Как спарсить подписчиков своего телеграм канала?
- 2 подписчика
- 20 часов назад
- 138 просмотров
0

ответов
Python

Простой
Каким образом я могу запускать привязанных ботов в основном, что-бы основной loop не ломался и не дублировался?
- 1 подписчик
- 15 нояб.
- 198 просмотров
0

ответов
Веб-разработка

+1 ещё

Простой
Каким образом правильно сделать скрипт?
- 2 подписчика
- 15 нояб.
- 303 просмотра
2

ответа
Python

Простой
Почему конвертация .py файла в .exe с помощью auto-py-to-exe происходит аномально долго и как это исправить?
- 1 подписчик
- 08 нояб.
- 236 просмотров
0

ответов
Python

+2 ещё

Простой
Как решить ошибку с отправкой почты через Outlook SMTP?
- 1 подписчик
- 08 нояб.
- 156 просмотров
0

ответов
Python

+2 ещё

Средний
Как конвертировать drawio (xml) в xml zabbix map?
- 2 подписчика
- 08 нояб.
- 127 просмотров
1

ответ
Python

Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
- 2 подписчика
- 31 окт.
- 256 просмотров
0

ответов
Python

Простой
Как сформировать изображение GS1 DataMatrix с функциональными знаками?
- 1 подписчик
- 31 окт.
- 141 просмотр
0

ответов
Python

+1 ещё

Простой
Почему callback_query_handler в telebot не работает?
- 1 подписчик
- 31 окт.
- 142 просмотра
3

ответа
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт.
- 146 просмотров
0

ответов
Показать ещё Загружается…

Python Software Engineer - ML/LLM

Ennabl • Лимассол

от 650 000 ₽

Backend Python Developer Middle/Senior

AppRoute

До 3 000 $

Python back-end engineer (+Kotlin)

YoloPrice

от 360 000 до 420 000 ₽

Answer 1 · 2021-11-03 12:08:27

Дело не в задержке, данные подгружаются динамически. По поводу парсинга динамических сайтов:
https://qna.habr.com/q/1038438#answer_2008702

Не знаю что вы собираете, но скорее всего все нужные данные тут
https://fapi.coinglass.com/api/cme/cot/report

Answer 2 · 2021-11-03 12:07:56

есть вероятность что это JS даёт задержку , вот тут предлагаю элегантное решение

from bs4 import BeautifulSoup
from selenium import webdriver

url = "http://legendas.tv/busca/walking%20dead%20s03e02"
browser = webdriver.PhantomJS()
browser.get(url)
html = browser.page_source
soup = BeautifulSoup(html, 'lxml')
a = soup.find('section', 'wrapper')

Задержка для парсера сайта?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт