@madreyk

Как конвертировать все найденные unicode последовательности чтобы он отображался в терминале?

У меня есть обычная строка, которая содержит разные unicode
последовательности (\u0439). В оболочке например я могу сделать
printf "\u0439\n", и мне выведут "й", как
возможно перевести все эти последовательности в настоящий unicode в
python?

Неработающие решения:
for char in re.findall("\\\\u....", dump):
	print(char.encode("utf-8"))`


Решено:
for char in re.findall("\\\\u....", dump):
	try:
		dump = re.sub("\\" + char, char.encode("latin-1").decode("unicode_escape"), dump, count=1)
	except:
		pass
  • Вопрос задан
  • 77 просмотров
Решения вопроса 1
Если есть 100%-ная уверенность, что во входной строке не будет НЕзаэкранированного юникода, и вообще все символы будут в Latin-1, то можно так:
print(s.encode('latin-1').decode('unicode_escape'))
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы