Как парсить данные, подгружаемые прокруткой страницы?

Question

Александр Бельтипетеров @Alex_Belt

Как парсить данные, подгружаемые прокруткой страницы?

Доброго времени суток!
Недавно начал учить Python и откопал у себя курс возрастом около 2 лет по парсингу. В первом уроке были примеры с сайтом Wordpress.org, там всё было хорошо, на сайте были изменения, но они касались больше наполнения, нежели структуры (вёрстки), а вот в следующем уроке рассказывается о парсинге табличных данных на примере сайта coinmarketcap.com, который претерпел изменения в структуре, как я понимаю, потому что в видео данный код получает все 100 значений, а сейчас только первые 10 и затем выдает ошибку AttributeError: 'NoneType' object has no attribute 'text'. Я понимаю почему возникает ошибка, программа "не видит" нужные данные, поскольку они подгружаются в процессе скроллинга к концу страницы, как мне кажется.
Как изменить данный код, чтобы он обрабатывал все 100 позиций с первой страницы этого сайта?
P.S. длина списка, собранного по тегу tr равна 100, значит строки с 11 по 100 считаются пустыми.

import requests
from bs4 import BeautifulSoup

def get_html(url):
	r = requests.get(url)
	return r.text

def get_page_data(html):
	soup = BeautifulSoup(html, 'lxml')

	trs = soup.find('table').find('tbody').find_all('tr')
	print(len(trs))

	for tr in trs:
		tds = tr.find_all('td')
		name = tds[2].find('a').find('p').text
		print(name)

def main():
	url = 'https://coinmarketcap.com'
	get_page_data(get_html(url))

if __name__ == '__main__':
	main()

Надеюсь услышать советы матёрых программистов и спасибо за внимание!

Вопрос задан более трёх лет назад
553 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Python-разработчик

10 месяцев

Далее
Нетология

Fullstack-разработчик на Python + нейросети

20 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Telegram

+1 ещё

Простой
Как спарсить подписчиков своего телеграм канала?
- 2 подписчика
- 14 часов назад
- 120 просмотров
0

ответов
Python

Простой
Каким образом я могу запускать привязанных ботов в основном, что-бы основной loop не ломался и не дублировался?
- 1 подписчик
- 15 нояб.
- 197 просмотров
0

ответов
Веб-разработка

+1 ещё

Простой
Каким образом правильно сделать скрипт?
- 2 подписчика
- 15 нояб.
- 303 просмотра
2

ответа
Python

Простой
Почему конвертация .py файла в .exe с помощью auto-py-to-exe происходит аномально долго и как это исправить?
- 1 подписчик
- 08 нояб.
- 235 просмотров
0

ответов
Python

+2 ещё

Простой
Как решить ошибку с отправкой почты через Outlook SMTP?
- 1 подписчик
- 08 нояб.
- 155 просмотров
0

ответов
Python

+2 ещё

Средний
Как конвертировать drawio (xml) в xml zabbix map?
- 2 подписчика
- 08 нояб.
- 127 просмотров
1

ответ
Python

Простой
Какой браузер с headless для python не распознаеться и не блокируеться google ai studio?
- 2 подписчика
- 31 окт.
- 255 просмотров
0

ответов
Python

Простой
Как сформировать изображение GS1 DataMatrix с функциональными знаками?
- 1 подписчик
- 31 окт.
- 141 просмотр
0

ответов
Python

+1 ещё

Простой
Почему callback_query_handler в telebot не работает?
- 1 подписчик
- 31 окт.
- 142 просмотра
3

ответа
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт.
- 146 просмотров
0

ответов
Показать ещё Загружается…

Python Software Engineer - ML/LLM

Ennabl • Лимассол

от 650 000 ₽

Backend Python Developer Middle/Senior

AppRoute

До 3 000 $

Python back-end engineer (+Kotlin)

YoloPrice

от 360 000 до 420 000 ₽

Answer 1 · 2021-07-17 06:56:10

Смотрим вкладку Сесть в консоли и видим, что данные подгружаются со ссылок:
Первая страница: https://api.coinmarketcap.com/data-api/v3/cryptocu...
Вторая страница: https://api.coinmarketcap.com/data-api/v3/cryptocu...
Третья страница: https://api.coinmarketcap.com/data-api/v3/cryptocu...
Их и парсите, как JSON. Логика формирования интуитивно понятна думаю.

Как парсить данные, подгружаемые прокруткой страницы?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт