Как залезть внутрь тега?

Question

Bruh_h_h_h @Bruh_h_h_h

Beautiful Soup

Как залезть внутрь тега?

хочу спарсить цену автопокупки предмета стим(число 1926,57), использую bs4 и requests
Когда получаю весь код страницы, пытаюсь найти по тегу нужный фрагмент, но он оказывается пустым, хотя на сайте его можно раскрыть и посмотреть внутрянку, код и скрины прилагаю

from bs4 import BeautifulSoup
import requests
html = requests.get("https://steamcommunity.com/market/listings/730/AK-47%20%7C%20Nightwish%20%28Minimal%20Wear%29")
soup = BeautifulSoup(html.text, "html.parser")
price = soup.find("div", id="market_commodity_buyrequests")
print(price)

А вот и весь вывод

<div id="market_commodity_buyrequests">
											 
										</div>

вот html этого куска
Скриншот фрагмента кода удален модератором.
при попытке взять тег span и класс "market_commodity_orders_header_promote", выдаёт либо None, либо []

Вопрос задан более трёх лет назад
111 просмотров

2 комментария

Подписаться 1 Простой 2 комментария

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Профессия Графический дизайнер PRO

15 месяцев

Далее
Нетология

Фронтенд-разработчик

11 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Beautiful Soup

Простой
Почему Soup.find возвращает None?
- 1 подписчик
- 03 авг.
- 86 просмотров
1

ответ
Python

+2 ещё

Простой
Как сделать, чтобы при парсинге bs4 как то надо нажать на кнопку «показать еще», чтобы подгрузило еще 20 постов?
- 1 подписчик
- 08 апр.
- 243 просмотра
2

ответа
Парсинг

+1 ещё

Простой
У меня не получается спарсить ссылку на фото с сайта, help?
- 1 подписчик
- 07 апр.
- 218 просмотров
2

ответа
Beautiful Soup

Средний
Как распарсить файл в табличной верстке через beatifulsoap?
- 1 подписчик
- 07 мар.
- 138 просмотров
1

ответ
Beautiful Soup

Простой
Нормально ли что парсинг занимает много оперативки?
- 2 подписчика
- более года назад
- 254 просмотра
2

ответа
Beautiful Soup

+1 ещё

Простой
Как пройти капчу при методе POST?
- 1 подписчик
- более года назад
- 256 просмотров
1

ответ
Beautiful Soup

Простой
Почему скачиваются миниатюры изображений вместо их полного размера?
- 1 подписчик
- более года назад
- 183 просмотра
0

ответов
Beautiful Soup

Простой
Почему парсер не выдаёт нужный результат?
- 1 подписчик
- более года назад
- 130 просмотров
1

ответ
Beautiful Soup

Простой
Python BeautifulSoup почему не работает код?
- 1 подписчик
- более года назад
- 81 просмотр
0

ответов
Beautiful Soup

Простой
Парсится только часть страницы. Как парсить всю страницу?
- 1 подписчик
- более года назад
- 82 просмотра
2

ответа
Показать ещё Загружается…

Python Software Engineer - ML/LLM

Ennabl • Лимассол

от 650 000 ₽

Backend developer

Creative Code

До 160 000 ₽

Deep Learning Engineer (GigaChat Prod)

Сбер • Москва

от 350 000 ₽

Кроме того, п.3.8 запрещает публиковать код в виде скриншотов.

Answer 1 · 2022-10-15 10:32:02

Я не знаю почему, НО у меня soup возвращает именно пустой тег , если смотреть браузером то тег не пустой. А soup берет ответ от requests, который возвращает неправильное:

<div id="market_commodity_buyrequests">\r\n\t\t\t\t\t\t\t\t\t\t\t&nbsp;\r\n\t\t\t\t\t\t\t\t\t\t</div>

Так что soup работает правильно.

Похоже на решение тут.

Answer 2 · 2022-10-15 10:48:37

Это называется "поленился погуглить". Вопрос уже задавали много раз, в т.ч. тут.
Вот мой недавний ответ на тот же вопрос.

Сейчас далеко не 90е, и на большинстве страниц полно JS-скриптов. Они, в том числе, могут делать фоновые (без перезагрузки страницы) запросы по ходу работы сайта. Так, например, реализуется "бесконечная лента" - по достижению низа страницы делается фоновый запрос, и новый контент подставляется вниз.
Некоторые сайты на этом вообще целиком построены - отдают основным запросом только болванку, а содержимое туда подсовывают фоновыми запросами. Как следствие, то, что ты выкачиваешь через requests, и то, что увидит пользователь в браузере - две большие разницы.
Соответственно, тут нужно:
1. Идентифицировать, какие фоновые запросы делает сайт. Инструменты разработчика в браузере в помощь.
2. Определить, какие из этих запросов подгружают нужную тебе информацию, и в каком виде она представлена. Нередко там не HTML-разметка, а формат JSON, с которым куда проще работать.
3. Определить, что нужно для выполнения этих запросов: какие URL дёргать, какие параметры подставлять, и т.д.
4. Попробовать имитировать только эти запросы.
Успех зависит от сайта, многие пытаются защищаться от такого, кто во что горазд.

Альтернативный вариант - использовать безголовый браузер. Но там своя гора проблем: это куда более ресурсоёмко, нужно дождаться полной прогрузки сайта, API для поиска там тоже своё. Так что я бы переходил к этому варианту только если имитировать запросы самому не вышло.

Как залезть внутрь тега?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт