Как использовать юникод в pythоn2.7?

Question

Илья @Quirel

Как использовать юникод в pythоn2.7?

Здравствуйте. Всегда использовал python3 (нормальная работа с юникодом - как раз одна из причин).
Сейчас захотел использовать библиотеку sccrapy, а она только под 2ю ветку.
С самой библиотекой боле менее разобрался, но тк нужно парсить сайт с кириллицей, то получаю вот такое

>>>s
u'\u043d\u0430'
>>>s.encode('utf-8')
'\xd0\xbd\xd0\xb0'

Посмотрел повнимательней, на сайте указано:

<meta http-equiv="Content-Type" content="text/html; charset=windows-1251" />

Но

>>>s.encode('windows-1251')
'\xed\xe0'

Соответственно тоже не помогло.
Собственно куда копать, как бороться с этим?

Вопрос задан более трёх лет назад
298 просмотров

Комментировать

Подписаться 4 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 207 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 536 просмотров
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 490 просмотров
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 279 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 504 просмотра
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 213 просмотров
2

ответа
Python

+2 ещё

Простой
Как правильно настроить статические и медиафайлы на хостинге?
- 1 подписчик
- 04 июн.
- 124 просмотра
1

ответ
Python

Простой
Как отправить видео в мессенджер MAX с прогрессом загрузки Python (tqdm)?
- 2 подписчика
- 30 мая
- 330 просмотров
1

ответ
Python

Простой
Стоит ли переходить на IDE?
- 1 подписчик
- 25 мая
- 663 просмотра
5

ответов
Python

+2 ещё

Простой
Где хранить сессию SQLAlchemy в FastAPI: в конструкторе сервиса или передавать в каждый метод?
- 2 подписчика
- 23 мая
- 345 просмотров
1

ответ
Показать ещё Загружается…

Answer 1 · 2015-04-11 23:58:01

u'\u043d\u0430' - это и есть юникод-представление строки (все что начинается с u'')
Метод encode позволяет закодировать юникод в нужную нам кодировку, например, для записи в файл и т.п.
В свое время сильно помогла данная статья: habrahabr.ru/post/135913

Как использовать юникод в pythоn2.7?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт