Почему метод find_all из bs4 возвращает пустой список?

Question

Neo01 @Neo01

Почему метод find_all из bs4 возвращает пустой список?

Мне нужно спарсить цифру (кол-во) подписчиков с аккаунта инстаграма. Передаю методу find_all тэг span и класс _ac2a, но find_all возвращает пустой список, хотя такой класс есть:

Причём данные с OLX (цена и описание) парсятся нормально

from bs4 import BeautifulSoup
import requests

estrade_url = 'https://www.instagram.com/estrade.pmk/'
page = requests.get(estrade_url)
soup = BeautifulSoup(page.text, 'lxml')
print(soup.find_all('span', class_='_ac2a'))

Вопрос задан более трёх лет назад
312 просмотров

5 комментариев

Подписаться Простой 5 комментариев

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как при вызове хранимой процедуры получать значения RAISE NOTICE?
- 2 подписчика
- 13 апр.
- 236 просмотров
2

ответа
Python

+2 ещё

Простой
Почему не работает Selenium?
- 1 подписчик
- 09 апр.
- 256 просмотров
2

ответа
Python

Простой
В чем ошибка в использовании ft.ResponsiveView в данном коде?
- 1 подписчик
- 08 апр.
- 89 просмотров
1

ответ
Python

Простой
Можно ли указывать во flet heigh и width через проценты?
- 1 подписчик
- 02 апр.
- 109 просмотров
1

ответ
Python

Простой
Как правильно позиционировать элементы во flet?
- 1 подписчик
- 02 апр.
- 101 просмотр
1

ответ
Python

Простой
Почему может не отображаться страница во view(flet)?
- 1 подписчик
- 25 мар.
- 123 просмотра
1

ответ
Python

Средний
Asyncio + PySide6 + Telethon: список чатов и треды грузятся 30 минут — где искать причину?
- 2 подписчика
- 16 мар.
- 472 просмотра
2

ответа
Python

+2 ещё

Средний
Можно ли получить доступ к сайту?
- 4 подписчика
- 05 мар.
- 1015 просмотров
4

ответа
Python

Простой
Как запретить удаление полей класса?
- 1 подписчик
- 27 февр.
- 327 просмотров
1

ответ
Парсинг

Простой
Как спарсить Интернет Магазин?
- 1 подписчик
- 27 февр.
- 381 просмотр
4

ответа
Показать ещё Загружается…

Python developer

ITK academy • Краснодар

от 220 000 до 300 000 ₽

Python Developer

ITK academy • Краснодар

от 75 000 ₽

Python разработчик

DimaTech Ltd • Краснодар

от 140 000 до 140 000 ₽

а page.status_code там 200? или что то другое?
А разве для доступа к какой-либо странице инстаграма не нужно быть авторизованным?
Neo01, Попробуй
print(soup.find_all('span', {'class':'_ac2a'})
Если тоже пусто, тогда читай ответы там дело пишут.
igor6130, Судя по тому что он не передаёт user-agent ему вообще до лампочки нужна авторизация или нет.

Answer 1 · 2023-01-13 14:09:41

spoiler

from bs4 import BeautifulSoup
import requests


headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36"}

estrade_url = 'https://www.instagram.com/estrade.pmk/'
page = requests.get(estrade_url,headers=headers)
soup = BeautifulSoup(page.content, 'html.parser')
print(soup.prettify())

Сравните ввыдод print(soup.prettify()) с тем что видите вы.
Без selenium тут не обойтись.
Я бы поступил так. Получил через селениум страницу. сохранил ее как index.html и дальше парсил.
Или не сохранял, а просто через селениум спарсил цифру.

Подход у всех разный

Answer 2 · 2023-01-13 14:10:30

А ты уверен, что то, что ты видишь в браузере - это то же, что получает на вход BS?
Инста может либо детектить тебя как бота, и отдавать другую страницу, или просто использовать JS для динамической подгрузки контента, отдавая статически только "болванку". BS не выполняет JS код, так что болванка - это всё, что он увидит в таком случае.
Скинь page.text в файл и посмотри, что там.

Почему метод find_all из bs4 возвращает пустой список?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт