kosyachniy
@kosyachniy
Python BackEnd, Web FullStack

SSL Python Как получить веб-страницу?

Нужно получить зашифрованную веб-страницу в нормальном виде
Есть такой код:
def get(src):
	context=ssl._create_unverified_context()
	with urlopen(src,context=context) as site:
		return site.read().decode()

С обычными веб-страницами всё хорошо, получает и отображает
Но при шифрованных проблемы:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xcf in position 102: invalid continuation byte

Если убрать decode(), то будет выводиться в формате b'...'
Как исправить это? Или есть другой способ нормального вывода полученного текста?
  • Вопрос задан
  • 323 просмотра
Решения вопроса 2
dimonchik2013
@dimonchik2013
non progredi est regredi
кодировка может быть и не utf8

посмотри, какую автовыбирает браузер или попробуй chardet
Ответ написан
Комментировать
kosyachniy
@kosyachniy Автор вопроса
Python BackEnd, Web FullStack
def get(src):
	context=ssl._create_unverified_context()
	with urlopen(src,context=context) as site:
		text=site.read()
		return text.decode(chardet.detect(text)['encoding'])
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы