Meys313
@Meys313

Почему requests возвращает html страницу с незакрытыми тегами, а в браузере все нормально?

В общем, пытаюсь проспарсить один сайт. requests возвращает html страницу с незакрытыми тегами<p> (в то время как в браузере всё ок), а затем уже, видимо, сам bs4 начинает закрывать теги, но делает это неправильно, в итоге получается каша

Вот банальный код:
import requests

URL = 'https://proproprogs.ru/django/model-mtv-marshrutizaciya-funkcii-predstavleniya'
response = requests.get(URL, headers={'User-Agent': 'Chrome/98.0.4758.82'})

print(response.text)


Результат на фото:
62095c3328a91449557676.jpeg

К слову, вот это делает уже bs4: 62095e279232d568099681.jpeg

гуглил, ответа не нашел. Чем вообще обусловлено такое поведение ? ошибки на уровне самого сайта ?
  • Вопрос задан
  • 157 просмотров
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
17 мая 2024, в 22:37
20000 руб./за проект
17 мая 2024, в 22:33
1000 руб./за проект
17 мая 2024, в 22:30
5000 руб./за проект