Как использовать юникод в pythоn2.7?

Здравствуйте. Всегда использовал python3 (нормальная работа с юникодом - как раз одна из причин).
Сейчас захотел использовать библиотеку sccrapy, а она только под 2ю ветку.
С самой библиотекой боле менее разобрался, но тк нужно парсить сайт с кириллицей, то получаю вот такое
>>>s
u'\u043d\u0430'
>>>s.encode('utf-8')
'\xd0\xbd\xd0\xb0'

Посмотрел повнимательней, на сайте указано:
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251" />

Но
>>>s.encode('windows-1251')
'\xed\xe0'

Соответственно тоже не помогло.
Собственно куда копать, как бороться с этим?
  • Вопрос задан
  • 293 просмотра
Пригласить эксперта
Ответы на вопрос 1
@ilov3
Учу питон и джангу потому что модно
u'\u043d\u0430' - это и есть юникод-представление строки (все что начинается с u'')
Метод encode позволяет закодировать юникод в нужную нам кодировку, например, для записи в файл и т.п.
В свое время сильно помогла данная статья: habrahabr.ru/post/135913
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы