В общем, пытаюсь проспарсить один
сайт. requests возвращает html страницу с незакрытыми тегами
<p>
(в то время как в браузере всё ок), а затем уже, видимо, сам bs4 начинает закрывать теги, но делает это неправильно, в итоге получается каша
Вот банальный код:
import requests
URL = 'https://proproprogs.ru/django/model-mtv-marshrutizaciya-funkcii-predstavleniya'
response = requests.get(URL, headers={'User-Agent': 'Chrome/98.0.4758.82'})
print(response.text)
Результат на фото:
К слову, вот это делает уже bs4:
гуглил, ответа не нашел. Чем вообще обусловлено такое поведение ? ошибки на уровне самого сайта ?