Как получить русский текст из json на Python?

Question

Александр @sajini

Python
JSON

Как получить русский текст из json на Python?

Пытаюсь распарсить json ответ на python

import requests
import json

apiUrl = "http://openapi.justin.ua/tracking/"
track = '201810165'
response = requests.get(apiUrl + track, verify=False)
obj = json.loads(response.text)
print(obj['result'][-1]['status'])

в ответе есть русские слова, но они закодированы

{"status":1,"msg":null,"result":[{"orderNumber":"201810165","orderDescription":"\u0417\u0430\u043c\u043e\u0432\u043b\u0435\u043d\u043d\u044f \u043a\u043b\u0456\u0454\u043d\u0442\u0430 201810165 \u0432\u0456\u0434 7\/25\/2018","date":"2019-02-27","time":"10:20:51","status":"\u041e\u0434\u0435\u0440\u0436\u0430\u043d\u043e","departmentNumber":"","departmentAdress":""}]}

Собственно вопрос, как из "\u041e\u0434\u0435\u0440\u0436\u0430\u043d\u043e" получить "Одержано"? Потому что даже эти символы питон не хочет выводить, выдает ошибку

UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-7: ordinal not in range(128)

Пробовал декодить и энкодить по всякому, ничего не помогает((

Вопрос задан более трёх лет назад
20460 просмотров

5 комментариев

Подписаться 4 Простой 5 комментариев

Сергей Горностаев @sergey-gornostaev Куратор тега Python

Выводить как и куда вы их пытаетесь?

Написано более трёх лет назад
Александр @sajini Автор вопроса

Сергей Горностаев, вышенаписанный код пишу в моделе django, получаю ответ json, пытаюсь записать нужное мне значение в файлик лога

Написано более трёх лет назад
Сергей Горностаев @sergey-gornostaev Куратор тега Python

Александр, значит у вас этот файлик открыт не в кодировке UTF-8, в которой кодированы записываемые данные.

Написано более трёх лет назад
Александр @sajini Автор вопроса

к сожалению в utf8. Для теста закинул код на фидл joxi.ru/Vm6ZLDECjjDlZm там та же ошибка

Написано более трёх лет назад
Сергей П @trapwalker Куратор тега Python

Александр, Я там ниже ответил. Он у вас UTF-8, но открыт как бинарный файл, видимо. Конвертируйте в utf-8 явно. Ну или показывайте код и я подскажу вам как настроить logging или что там у вас

Написано более трёх лет назад

Решения вопроса 2

1 комментарий

Пригласить эксперта

Ответы на вопрос 3

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

Простой
Как написать программу для определения количества осей симетрии четыреугольника?
- 1 подписчик
- час назад
- 32 просмотра
1

ответ
Python

Простой
Как в конце каждой строки файла добавить тэг??
- 1 подписчик
- 2 часа назад
- 45 просмотров
1

ответ
Python

+1 ещё

Простой
Почему asyncio.current_task() не передается в функцию?
- 1 подписчик
- 2 часа назад
- 31 просмотр
1

ответ
Python

+2 ещё

Простой
Срабатывает антивирус на скомпилированный файл python, как исправить?
- 1 подписчик
- 21 час назад
- 159 просмотров
1

ответ
Python

Простой
Почему не срабатывает if? как это пофиксить?
- 1 подписчик
- вчера
- 122 просмотра
2

ответа
Python

+2 ещё

Простой
Как транслировать аудио в микрофон, py, c#, c++?
- 1 подписчик
- вчера
- 145 просмотров
3

ответа
Python

Средний
Почему Низкий FPS анализ изображения yolov8 YOLO?
- 1 подписчик
- вчера
- 24 просмотра
0

ответов
Python

+2 ещё

Простой
Почему Планировщик задач Windows 10 не выполняет скрипт Python?
- 3 подписчика
- вчера
- 1344 просмотра
3

ответа
Python

+1 ещё

Средний
Как переместить мышь вместе с элементом в pyppeteer?
- 1 подписчик
- вчера
- 90 просмотров
0

ответов
Python

+2 ещё

Простой
OK.RU, API приложений, не могу загрузить видео: User must grant an access to permission 'VIDEO_CONTENT'". Как получить этиправа для приложения?
- 1 подписчик
- 21 апр.
- 53 просмотра
1

ответ
Показать ещё Загружается…

Python developer

Bell Integrator

До 350 000 ₽

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

TeamLead Python

AGIMA • Москва

До 350 000 ₽

Доработка парсера

23 апр. 2024, в 19:21

300 руб./за проект

Верстка сайта

23 апр. 2024, в 19:05

15000 руб./за проект

Создать учебный сайт на React

23 апр. 2024, в 19:01

7000 руб./за проект

Выводить как и куда вы их пытаетесь?
Сергей Горностаев, вышенаписанный код пишу в моделе django, получаю ответ json, пытаюсь записать нужное мне значение в файлик лога
Александр, значит у вас этот файлик открыт не в кодировке UTF-8, в которой кодированы записываемые данные.
к сожалению в utf8. Для теста закинул код на фидл joxi.ru/Vm6ZLDECjjDlZm там та же ошибка
Александр, Я там ниже ответил. Он у вас UTF-8, но открыт как бинарный файл, видимо. Конвертируйте в utf-8 явно. Ну или показывайте код и я подскажу вам как настроить logging или что там у вас

Answer 1 · 2020-01-20 18:05:11

Так проблемы с записью в файл?

json.dump(obj, fp, *, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, cls=None, indent=None, separators=None, default=None, sort_keys=False, **kw)

выделенное в False, json по умолчанию юникод кодирует так. Файл должен быть открыт в utf-8

Answer 2 · 2020-01-20 18:11:13

Не надо там ничего энкодить и декодить.
В ответе текст в юникоде и парсится функцией `json.loads` адекватно.
Проблема скорее всего у вас из-за кодировки в консоли винды. там какая-нибудь однобайтовая кодировка вроде cp1251 или cp866.
При попытке напечатать юникод в этом терминале вы получаете ошибку из-за того, что при автоматическом преобразовании из юникода в кодировку консоли питон пытается взять кодек по умолчанию, который, конечно 'ascii'.

Винда такая винда со своим беспощадным терминалом и кодировками по умолчанию.

Но вы можете напечатать этот текст, в нём нет непечатных символов для однобайтовой кодировки. Попробуйте так:

x = obj['result'][-1]['status']
try:
    print('cp1251:', x.encode('cp1251'))
except:
    try:
        print('cp866:', x.encode('cp866'))
    except:
        print('no way')

Общие правила работы с кодировками такие:
- на входе в программу мы всё преобразовываем в юникод.
- на выходе всё кодируем в нужную кодировку.
- если выход - это печать в стандартный вывод (stdout), то ситуаций может быть 4:
1) печатаем в терминал винды и терминал у нас в кодировке 1251
2) печатаем в терминал и он у нас в 866 кодировке
3) печатаем в stdout, который перенаправлен в файл и пайп не знает в какой он кодировке, то есть кодировка не задана и мы можем заэнкодить в любую и в файл это запишется. Пользутейс utf8 - самая правильная кодировка для всего.
4) вы в линуксе и терминал у вас в кодировке по умолчанию - utf8 и всё хорошо.

В любом случае, печатая или сохраняя что-то в файл вы должны понимать, что текст нужно закодировать в кодировку. Это может произойти неявно (как в ашем случае) но при попытке закодировать в кодировку по умолчанию (ascii) не каждый символ в ней можно представить. В ASCII всего 127 символов. Получилась закономерная ошибка.

У потоков стандартного ввода/вывода есть атрибут encoding:

import sys
sys.stdout.encoding  # 'UTF-8'

В вашем случае будет либо None, если вывод перенаправлен в файл,
либо 'cp1251', либо 'cp866' ну или ещё что-нибудь эдакое.
Если не None, то в эту кодировку можно постараться заэнкодить вашу строку. По-прежнему некоторые символы могут не конвертнуться (не в вашем случае), их можно игнорировать специальным аргументом метода encode.

Answer 3 · 2020-01-20 14:53:51

Андрей @anerev

b"\u041e\u0434\u0435\u0440\u0436\u0430\u043d\u043e".decode('unicode-escape')

Ответ написан более трёх лет назад

1 комментарий

Answer 4 · 2020-11-01 00:45:41

Возможно имеется ввиду кодировка, непосредственно при получении json от сервера.
Тогда решение такое. Проверяем текущую кодировку в библиотеке Requests.

print(responce.encoding)  # ISO-8859-1
Меняем на utf-8
<code lang="python">
responce.encoding = "utf-8"
</code>

Вместе приблизительно так: 
<code lang="python">
url = "https://your_url.me"
responce = requests.get(url=url)
responce.encoding = "utf-8" # После этой строки кириллические символы вместо экранированных
</code>

Answer 5 · 2022-04-16 15:00:58

Проверяешь языки командой:
locale

На месте LC_CTYPE должна быть пометка UTF-8, если нет, то пишешь:
export LC_CTYPE="en_US.UTF-8"

А если не помогло, то меняй всем значениям кодировку:
export LC_ALL="en_US.UTF-8"

Я сразу прописал для всех и стал получать инфу на человеческом языке.

Как получить русский текст из json на Python?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт