Задать вопрос
Meys313
@Meys313

Почему requests возвращает html страницу с незакрытыми тегами, а в браузере все нормально?

В общем, пытаюсь проспарсить один сайт. requests возвращает html страницу с незакрытыми тегами<p> (в то время как в браузере всё ок), а затем уже, видимо, сам bs4 начинает закрывать теги, но делает это неправильно, в итоге получается каша

Вот банальный код:
import requests

URL = 'https://proproprogs.ru/django/model-mtv-marshrutizaciya-funkcii-predstavleniya'
response = requests.get(URL, headers={'User-Agent': 'Chrome/98.0.4758.82'})

print(response.text)


Результат на фото:
62095c3328a91449557676.jpeg

К слову, вот это делает уже bs4: 62095e279232d568099681.jpeg

гуглил, ответа не нашел. Чем вообще обусловлено такое поведение ? ошибки на уровне самого сайта ?
  • Вопрос задан
  • 170 просмотров
Подписаться 1 Простой Комментировать
Помогут разобраться в теме Все курсы
  • Нетология
    Fullstack-разработчик на Python + нейросети
    20 месяцев
    Далее
  • Skillfactory
    Профессия Python-разработчик
    9 месяцев
    Далее
  • SF Education
    Бэкенд-разработчик на Python
    3 месяца
    Далее
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы