Как получить русский текст из json на Python?

Question

Александр @sajini

Python
JSON

Как получить русский текст из json на Python?

Пытаюсь распарсить json ответ на python

import requests
import json

apiUrl = "http://openapi.justin.ua/tracking/"
track = '201810165'
response = requests.get(apiUrl + track, verify=False)
obj = json.loads(response.text)
print(obj['result'][-1]['status'])

в ответе есть русские слова, но они закодированы

{"status":1,"msg":null,"result":[{"orderNumber":"201810165","orderDescription":"\u0417\u0430\u043c\u043e\u0432\u043b\u0435\u043d\u043d\u044f \u043a\u043b\u0456\u0454\u043d\u0442\u0430 201810165 \u0432\u0456\u0434 7\/25\/2018","date":"2019-02-27","time":"10:20:51","status":"\u041e\u0434\u0435\u0440\u0436\u0430\u043d\u043e","departmentNumber":"","departmentAdress":""}]}

Собственно вопрос, как из "\u041e\u0434\u0435\u0440\u0436\u0430\u043d\u043e" получить "Одержано"? Потому что даже эти символы питон не хочет выводить, выдает ошибку

UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-7: ordinal not in range(128)

Пробовал декодить и энкодить по всякому, ничего не помогает((

Вопрос задан более трёх лет назад
24207 просмотров

5 комментариев

Подписаться 4 Простой 5 комментариев

Сергей Горностаев @sergey-gornostaev Куратор тега Python

Выводить как и куда вы их пытаетесь?

Написано более трёх лет назад
Александр @sajini Автор вопроса

Сергей Горностаев, вышенаписанный код пишу в моделе django, получаю ответ json, пытаюсь записать нужное мне значение в файлик лога

Написано более трёх лет назад
Сергей Горностаев @sergey-gornostaev Куратор тега Python

Александр, значит у вас этот файлик открыт не в кодировке UTF-8, в которой кодированы записываемые данные.

Написано более трёх лет назад
Александр @sajini Автор вопроса

к сожалению в utf8. Для теста закинул код на фидл joxi.ru/Vm6ZLDECjjDlZm там та же ошибка

Написано более трёх лет назад
Сергей П @trapwalker Куратор тега Python

Александр, Я там ниже ответил. Он у вас UTF-8, но открыт как бинарный файл, видимо. Конвертируйте в utf-8 явно. Ну или показывайте код и я подскажу вам как настроить logging или что там у вас

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия: Python-разработчик + ИИ

8 месяцев

Далее

Решения вопроса 2

1 комментарий

Пригласить эксперта

Ответы на вопрос 3

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+3 ещё

Простой
Авто торговля на байбите?
- 1 подписчик
- 15 мая
- 327 просмотров
1

ответ
Python

Простой
Как научиться извлекать математическую модель для решения задач на программирование?
- 1 подписчик
- 14 мая
- 232 просмотра
2

ответа
Python

+3 ещё

Средний
Как перенести позу SMPL модели на игровую 3д модель?
- 2 подписчика
- 10 мая
- 283 просмотра
1

ответ
Python

+1 ещё

Простой
Как при вызове хранимой процедуры получать значения RAISE NOTICE?
- 2 подписчика
- 13 апр.
- 280 просмотров
2

ответа
Python

+2 ещё

Простой
Почему не работает Selenium?
- 1 подписчик
- 09 апр.
- 315 просмотров
2

ответа
Python

Простой
В чем ошибка в использовании ft.ResponsiveView в данном коде?
- 1 подписчик
- 08 апр.
- 103 просмотра
1

ответ
Python

Простой
Можно ли указывать во flet heigh и width через проценты?
- 1 подписчик
- 02 апр.
- 118 просмотров
1

ответ
Python

Простой
Как правильно позиционировать элементы во flet?
- 1 подписчик
- 02 апр.
- 108 просмотров
1

ответ
Python

Простой
Почему может не отображаться страница во view(flet)?
- 1 подписчик
- 25 мар.
- 128 просмотров
1

ответ
Python

Средний
Asyncio + PySide6 + Telethon: список чатов и треды грузятся 30 минут — где искать причину?
- 2 подписчика
- 16 мар.
- 487 просмотров
2

ответа
Показать ещё Загружается…

Выводить как и куда вы их пытаетесь?
Сергей Горностаев, вышенаписанный код пишу в моделе django, получаю ответ json, пытаюсь записать нужное мне значение в файлик лога
Александр, значит у вас этот файлик открыт не в кодировке UTF-8, в которой кодированы записываемые данные.
к сожалению в utf8. Для теста закинул код на фидл joxi.ru/Vm6ZLDECjjDlZm там та же ошибка
Александр, Я там ниже ответил. Он у вас UTF-8, но открыт как бинарный файл, видимо. Конвертируйте в utf-8 явно. Ну или показывайте код и я подскажу вам как настроить logging или что там у вас

Answer 1 · 2020-01-20 18:05:11

Так проблемы с записью в файл?

json.dump(obj, fp, *, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, cls=None, indent=None, separators=None, default=None, sort_keys=False, **kw)

выделенное в False, json по умолчанию юникод кодирует так. Файл должен быть открыт в utf-8

Answer 2 · 2020-01-20 18:11:13

Не надо там ничего энкодить и декодить.
В ответе текст в юникоде и парсится функцией `json.loads` адекватно.
Проблема скорее всего у вас из-за кодировки в консоли винды. там какая-нибудь однобайтовая кодировка вроде cp1251 или cp866.
При попытке напечатать юникод в этом терминале вы получаете ошибку из-за того, что при автоматическом преобразовании из юникода в кодировку консоли питон пытается взять кодек по умолчанию, который, конечно 'ascii'.

Винда такая винда со своим беспощадным терминалом и кодировками по умолчанию.

Но вы можете напечатать этот текст, в нём нет непечатных символов для однобайтовой кодировки. Попробуйте так:

x = obj['result'][-1]['status']
try:
    print('cp1251:', x.encode('cp1251'))
except:
    try:
        print('cp866:', x.encode('cp866'))
    except:
        print('no way')

Общие правила работы с кодировками такие:
- на входе в программу мы всё преобразовываем в юникод.
- на выходе всё кодируем в нужную кодировку.
- если выход - это печать в стандартный вывод (stdout), то ситуаций может быть 4:
1) печатаем в терминал винды и терминал у нас в кодировке 1251
2) печатаем в терминал и он у нас в 866 кодировке
3) печатаем в stdout, который перенаправлен в файл и пайп не знает в какой он кодировке, то есть кодировка не задана и мы можем заэнкодить в любую и в файл это запишется. Пользутейс utf8 - самая правильная кодировка для всего.
4) вы в линуксе и терминал у вас в кодировке по умолчанию - utf8 и всё хорошо.

В любом случае, печатая или сохраняя что-то в файл вы должны понимать, что текст нужно закодировать в кодировку. Это может произойти неявно (как в ашем случае) но при попытке закодировать в кодировку по умолчанию (ascii) не каждый символ в ней можно представить. В ASCII всего 127 символов. Получилась закономерная ошибка.

У потоков стандартного ввода/вывода есть атрибут encoding:

import sys
sys.stdout.encoding  # 'UTF-8'

В вашем случае будет либо None, если вывод перенаправлен в файл,
либо 'cp1251', либо 'cp866' ну или ещё что-нибудь эдакое.
Если не None, то в эту кодировку можно постараться заэнкодить вашу строку. По-прежнему некоторые символы могут не конвертнуться (не в вашем случае), их можно игнорировать специальным аргументом метода encode.

Answer 3 · 2020-01-20 14:53:51

Андрей @anerev

b"\u041e\u0434\u0435\u0440\u0436\u0430\u043d\u043e".decode('unicode-escape')

Ответ написан более трёх лет назад

1 комментарий

Answer 4 · 2020-11-01 00:45:41

Возможно имеется ввиду кодировка, непосредственно при получении json от сервера.
Тогда решение такое. Проверяем текущую кодировку в библиотеке Requests.

print(responce.encoding)  # ISO-8859-1
Меняем на utf-8
<code lang="python">
responce.encoding = "utf-8"
</code>

Вместе приблизительно так: 
<code lang="python">
url = "https://your_url.me"
responce = requests.get(url=url)
responce.encoding = "utf-8" # После этой строки кириллические символы вместо экранированных
</code>

Answer 5 · 2022-04-16 15:00:58

Проверяешь языки командой:
locale

На месте LC_CTYPE должна быть пометка UTF-8, если нет, то пишешь:
export LC_CTYPE="en_US.UTF-8"

А если не помогло, то меняй всем значениям кодировку:
export LC_ALL="en_US.UTF-8"

Я сразу прописал для всех и стал получать инфу на человеческом языке.

Как получить русский текст из json на Python?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт