Почему при открытии сайта с помощью urlopen выводить b'\x1f\x8b\x08\?

Question

Conan_Doyle @Conan_Doyle

Python

Почему при открытии сайта с помощью urlopen выводить b'\x1f\x8b\x08\?

from urllib.request import urlopen
html = urlopen("https://wallpaperscraft.ru")
print(html.read())

"""
output:

b'\x1f\x8b\x08\x00\x00\x00\x00\x00\x00\x03\xed]{\x8f\x1b\xc7\x91\xff_\x9fb\x8e\x81#\t\x10\x97\xef\xc7J\xbb\x1b8~\xc09\xe4.\x06\

и так далее...

"""

Вопрос задан более трёх лет назад
1013 просмотров

1 комментарий

Подписаться 2 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 209 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 544 просмотра
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 493 просмотра
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 281 просмотр
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 507 просмотров
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 214 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 125 просмотров
1

ответ
Python

Простой
Как отправить видео в мессенджер MAX с прогрессом загрузки Python (tqdm)?
- 2 подписчика
- 30 мая
- 330 просмотров
1

ответ
Python

Простой
Стоит ли переходить на IDE?
- 1 подписчик
- 25 мая
- 663 просмотра
5

ответов
Python

+2 ещё

Простой
Где хранить сессию SQLAlchemy в FastAPI: в конструкторе сервиса или передавать в каждый метод?
- 2 подписчика
- 23 мая
- 345 просмотров
1

ответ
Показать ещё Загружается…

на решение не претендую, но requests нормально выводит. если впринципе нет жесткого требования использовать только стандартную библиотеку, лучше всегда брать requests

Answer 1 · 2019-01-24 11:34:05

Если посмотреть на заголовки

>>> html.info()
<http.client.HTTPMessage object at 0x10aef1518>
>>> html.info().items()

То там можно заметить ('Content-Encoding', 'gzip')
Это значит, что данные сжаты.
Нужно их распаковать:

>>> data = html.read()
>>> import gzip
>>> gzip.decompress(data)

Для получения страницы можно воспользоваться и другим способом

>>> import requests
>>> response = requests.get("https://wallpaperscraft.ru")
>>> response.content

Answer 2 · 2019-01-24 11:28:16

У вас gzip, сжаты данные

import urllib
import zlib

html = urllib.urlopen("https://wallpaperscraft.ru")

decompressed_data=zlib.decompress(html.read(), 16+zlib.MAX_WBITS)
print decompressed_data

Почему при открытии сайта с помощью urlopen выводить b'\x1f\x8b\x08\?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт