Задать вопрос
@Timebird

Как решить проблемы с кодировкой при re.split?

Здравствуйте!
Имеется файл .txt с кодировкой UTF-8 и кириллицей. В jupyter открывается нормально (macOS).
Хочу сделать по нему разделение по табам: пишу f.split('/t'). Получаю что-то типа:
xd0\xbc\xd0\xb0\xd0\xb3\xd0\xb0 \xd0\xbb\xd0\xb8\xd1\x81\xd1\x82\xd0\xbe\xd0\xb2\xd0\xb0\xd1\x8f

Разделение на слова правильное, а вот кодировка поломалась. Как починить?
Заранее спасибо).
  • Вопрос задан
  • 117 просмотров
Подписаться 1 Простой Комментировать
Пригласить эксперта
Ответы на вопрос 1
delvin-fil
@delvin-fil
Crazy Linux-admin
Так:

"Разделениена слова правильное,а вот кодировка поломалась.Как починить?"
with open('zzz.txt') as f:
	mylist = [line.split('\t') for line in f]
	print (mylist)


[['Разделение', 'на слова правильное,', 'а вот кодировка поломалась.', 'Как починить?']]
[Finished in 0.2s]
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
22 дек. 2024, в 20:40
10000 руб./за проект
22 дек. 2024, в 20:34
3000 руб./за проект
22 дек. 2024, в 20:12
10000 руб./за проект