BS4 не видит полный код страницы?

Question

Denis Klimanov @stantes

Python
lxml

BS4 не видит полный код страницы?

Пример страницы https://zarabotay-na-domu.ru/c52-235697.html
имеет такой блок кода

<index>
    <h1 class="message_title">Зарабатываем дома по интернету.</h1>
    <div class="message_text">
    Моё предложение для тех, кто ищет возможности зарабатывать дома. <br>
     Хотите стать менеджером интернет-магазина нашей компании? <br>
     Вы сможете зарабатывать с нуля и до 1 000, 2 000 или 3 000 долларов, <br>
     - Ваша зарплата зависит от Вашей активности. <br>
     Есть система обучения и сопровождения до результата, Вы можете развиваться<br>
     по карьере. За отличные результаты есть премии и бонусы. <br>
     Самое главное, что Вы ничем не рискуете. . . ну разве что разбогатеть! <br>
     Бизнес легальный и честный. Пишите!</div>
    <div class="cat_fields"></div>
    </index>

Пытаюсь получить текст из блока с классом "message_text"

def get_html(url):
        r = session.get(url, headers=headers)
        return r.text
    
    soup = BeautifulSoup(get_html(url), 'lxml')
    post_text = soup.find('div', {'class': 'message_text'})
    print(post_text)

Получаю только это:
Бизнес легальный и честный. Пишите!</div>

Если распечатать содержимое html
print(get_html(url))
Код получается не полный
Однако, если сохранить файл с кодом страницы

with open(file_name, 'w') as f:
        f.write(get_html(url))

то в файле присутствует все необходимое.

В чем может быть проблема???

Вопрос задан более трёх лет назад
279 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- вчера
- 73 просмотра
1

ответ
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 17 июл.
- 88 просмотров
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 303 просмотра
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 234 просмотра
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 649 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 550 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 307 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 566 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 228 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 140 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2021-12-12 12:27:54

Однако, если сохранить файл с кодом страницы то в файле присутствует все необходимое.

Значит дело не в BS, а в том как ты выводишь содержимое в консоль.
Подскажу в чём может быть дело:

>>> print("foo\rbar")
bar

Символ \n - это перевод строки, но \r - возврат каретки. Если в искомой строке есть \r, но нет \n, то все строки будут выводиться поверх друг друга.

BS4 не видит полный код страницы?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт