Не получается спарсить, что делаю не так?

Question

RimMirK @RimMirK

Вроде человек. Вроде учусь. Вроде пайтону

Beautiful Soup

Не получается спарсить, что делаю не так?

url = f'https://ru.beincrypto.com/price/'
r = requests.get(url)
print(len(r.text)) # 7078
soup = bs(r.text, 'lxml')
trs = soup.find("tr", { "data-id" : "bitcoin" })
print(trs)

на сайте есть такой тег с таким аттрибутом:<tr data-id="bitcoin" class="">

spoiler

r.text не пустой. что делаю не так?

Вопрос задан более двух лет назад
135 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Помогут разобраться в теме Все курсы

Нетология

Фронтенд-разработчик

11 месяцев

Далее
Skillfactory

DevOps-инженер

6 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее

Решения вопроса 1

3 комментария

RimMirK @RimMirK Автор вопроса

мне разово надо. Я про юзер агент знаю, парсил другой сайт, и все ок было. Тут длинна спарсиного 7к символов, вот и подумал что все ок, а оказалось там джаваскрипта на 5к симв.

Написано более двух лет назад
RimMirK @RimMirK Автор вопроса

интересно, ваш юзер агент работает, а мой нет

Написано более двух лет назад
Максим Припадчев @Maksim_64

RimMirK, Это парсинг, сегодня мой работает а завтра не факт. Лучше иметь их кучу и выбирать случайно.

Написано более двух лет назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Beautiful Soup

Простой
Почему Soup.find возвращает None?
- 1 подписчик
- 03 авг.
- 85 просмотров
1

ответ
Python

+2 ещё

Простой
Как сделать, чтобы при парсинге bs4 как то надо нажать на кнопку «показать еще», чтобы подгрузило еще 20 постов?
- 1 подписчик
- 08 апр.
- 243 просмотра
2

ответа
Парсинг

+1 ещё

Простой
У меня не получается спарсить ссылку на фото с сайта, help?
- 1 подписчик
- 07 апр.
- 218 просмотров
2

ответа
Beautiful Soup

Средний
Как распарсить файл в табличной верстке через beatifulsoap?
- 1 подписчик
- 07 мар.
- 138 просмотров
1

ответ
Beautiful Soup

Простой
Нормально ли что парсинг занимает много оперативки?
- 2 подписчика
- 17 нояб. 2024
- 254 просмотра
2

ответа
Beautiful Soup

+1 ещё

Простой
Как пройти капчу при методе POST?
- 1 подписчик
- более года назад
- 255 просмотров
1

ответ
Beautiful Soup

Простой
Почему скачиваются миниатюры изображений вместо их полного размера?
- 1 подписчик
- более года назад
- 183 просмотра
0

ответов
Beautiful Soup

Простой
Почему парсер не выдаёт нужный результат?
- 1 подписчик
- более года назад
- 130 просмотров
1

ответ
Beautiful Soup

Простой
Python BeautifulSoup почему не работает код?
- 1 подписчик
- более года назад
- 81 просмотр
0

ответов
Beautiful Soup

Простой
Парсится только часть страницы. Как парсить всю страницу?
- 1 подписчик
- более года назад
- 82 просмотра
2

ответа
Показать ещё Загружается…

UI/UX Designer (приложение для поиска подруг)

SUMMEET

от 1 000 до 1 200 $

React Native разработчик в VSRAP

VSRAP Shop • Санкт-Петербург

от 150 000 до 220 000 ₽

Системный аналитик

Bitbanker.ru

от 240 000 ₽

Answer 1 · 2023-05-05 12:49:36

у тебя у r status_code 403. Добавь хоть какой нибудь header.

headers = {
  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; rv:91.0) Gecko/20100101 Firefox/91.0'
}
r = requests.get(url,headers=headers)

Вот так сервер пришлет html.
Имей также ввиду что парсить интерактивно (в рамках одного соединения) с bs не получится, придется переподключаться часто ну и схватишь блок или ерунду начнет присылать в ответ. Если ты перейдешь на страницу, зайдешь в инспектор, нажмешь на значек настройка в панели инспектора, затем поставишь галочку Disable JavaScript и обновишь страницу, вся инфа на странице перестанет обновляться. По скольку обновление происходит средствами JavaScript a bs не работает с JavaScript.

Не получается спарсить, что делаю не так?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт