Запрос:
requests.get("https://site.ru", headers)
к двум разным сайтам выдал разные ответы. В одном случае кириллический текст был нормальный, в другом выглядел так:
СкÑ\x83пка
Сделал string.encode('utf-8') но это не помогло и текст стал выглядеть так:
\xc3\x90\xc2\xa1\xc3\x90\xc2\xba\xc3\x91\\x83\
Формально и там и там на сайтах стоит мета-тег UTF-8 но на одном он видимо не соответствует реальной кодировке.
Тогда я посмотрел
print(string.headers)
и не увидел ничего необычного, кодировка никакая не передаётся в заголовках
{'Server': 'nginx', 'Date': 'Wed, 11 Jun 2025 11:41:21 GMT', 'Content-Type': 'text/html', 'Transfer-Encoding': 'chunked', 'Connection': 'keep-alive', 'Vary': 'Accept-Encoding', 'Cache-Control': 'max-age=604800, public', 'Content-Encoding': 'gzip'}
Вопроса 2:
1. Какой метод определения истинной колировки веб-страницы лучше использовать
2. Можно ли перекодировать полученный текст в читаемый или всё же его изначально надо забирать правильно а с этим ничего не сделать