Split и русские строки в Python 2.X

Question

xSkyFoXx @xSkyFoXx

Split и русские строки в Python 2.X

Вот такой короткий пример:

# -*- coding: utf-8 -*-

my_str = u'Строка ^ с ^ разделителями!'

print my_str.replace(' ', '')

print my_str.replace(' ', '').split('^')

Дает вот такой ужасный результат:

Строка^с^разделителями!

[u'\u0421\u0442\u0440\u043e\u043a\u0430 ', u' \u0441 ', u' \u0440\u0430\u0437\u0434\u0435\u043b\u0438\u0442\u0435\u043b\u044f\u043c\u0438!']

Подскажите, пожалуйста, как это побороть? Как после split'а вернуться к нормальным строкам?

P.S.
Кодировка файла-скрипта — utf8

Вопрос задан более трёх лет назад
4388 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 1

2 комментария

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+2 ещё

Сложный
Как решить задачу на 3D DP?
- 1 подписчик
- вчера
- 126 просмотров
2

ответа
Python

+1 ещё

Средний
Почему не работает пример quickstart из документации GLiNKER?
- 1 подписчик
- 19 июл.
- 93 просмотра
1

ответ
Python

Средний
Как правильно определять изменяющиеся типы полей при наследовании классов в python?
- 1 подписчик
- 17 июл.
- 107 просмотров
1

ответ
Python

+2 ещё

Простой
Можно ли полностью отказаться от vkhost в пользу VK ID для серверного приложения?
- 3 подписчика
- 14 июл.
- 365 просмотров
0

ответов
Python

+1 ещё

Простой
Почему разрывается подключение к бд на сервере?
- 1 подписчик
- 18 июн.
- 240 просмотров
1

ответ
Python

+2 ещё

Средний
Как новичку найти первые заказы на парсинг данных (Python)?
- 1 подписчик
- 17 июн.
- 672 просмотра
2

ответа
Python

+1 ещё

Сложный
Как на Python реализовать алгоритм, чтобы персонаж шёл по определенному маршруту в Genshin Impact?
- 3 подписчика
- 15 июн.
- 554 просмотра
2

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 309 просмотров
2

ответа
Python

+1 ещё

Средний
Telethon отказывается соединятся с серверами Telegram, как это обойти?
- 1 подписчик
- 10 июн.
- 573 просмотра
1

ответ
Python

+1 ещё

Простой
Почему копируется атрибут при создании нового экземпляра?
- 1 подписчик
- 08 июн.
- 229 просмотров
2

ответа
Показать ещё Загружается…

Answer 1 · 2011-12-01 13:20:39

MikhailEdoshin @MikhailEdoshin

То есть это нормальные строки — напечатайте, скажем, первую print my_str.replace(' ', '').split('^')[0] и увидите.

Ответ написан более трёх лет назад

2 комментария

Answer 2 · 2011-12-01 13:02:29

Потому что печать списка печатает repr() от его элементов.
см. Container’s __str__ uses contained objects’ __repr__

Можно например печатать так:

for item in lst: print item

Еще немного инфы здесь: см. с фразы Since this question involves a lot of confusing unicode stuff, I thought I'd offer an analysis of what was going on here.

Split и русские строки в Python 2.X

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт