Почему слетает кодировка?

Question

Max @maximsemin23

Python
JSON

Почему слетает кодировка?

Есть у меня код:

from json import dump
from bs4 import BeautifulSoup
from requests import get


def parse():
    request = get('https://ru.wikipedia.org/wiki/%D0%A1%D0%BF%D0%B8%D1%81%D0%BE%D0%BA_%D0%B4%D0%BE%D0%BC%D0%B5%D0%BD%D0%BE%D0%B2_%D0%B2%D0%B5%D1%80%D1%85%D0%BD%D0%B5%D0%B3%D0%BE_%D1%83%D1%80%D0%BE%D0%B2%D0%BD%D1%8F')
    request.encoding = 'utf-8'
    soup = BeautifulSoup(request.text, 'html.parser')
    tables = soup.find_all('table')
    table = tables[3]

    trs = table.find_all('tr')
    del trs[0]
    country = []

    for tr in trs:
        td = tr.find_all('td')
        country.append(td[1].text)

    for i in range(len(country)):
        country[i] = country[i].replace(u'\xa0', u'')

    with open(r'D:\API\translate.json', 'w', encoding='utf-8') as file:
        dump(country, file)

if __name__ == '__main__':
    parse()

translate.json после выполнения программы:

spoiler

["\u041e\u0441\u0442\u0440\u043e\u0432 \u0412\u043e\u0437\u043d\u0435\u0441\u0435\u043d\u0438\u044f", "\u0410\u043d\u0434\u043e\u0440\u0440\u0430", "\u041e\u0410\u042d", "\u0410\u0444\u0433\u0430\u043d\u0438\u0441\u0442\u0430\u043d", "\u0410\u043d\u0442\u0438\u0433\u0443\u0430 \u0438 \u0411\u0430\u0440\u0431\u0443\u0434\u0430", "\u0410\u043d\u0433\u0438\u043b\u044c\u044f", "\u0410\u043b\u0431\u0430\u043d\u0438\u044f", "\u0410\u0440\u043c\u0435\u043d\u0438\u044f", "\u041d\u0438\u0434\u0435\u0440\u043b\u0430\u043d\u0434\u0441\u043a\u0438\u0435 \u0410\u043d\u0442\u0438\u043b\u044c\u0441\u043a\u0438\u0435 \u043e\u0441\u0442\u0440\u043e\u0432\u0430", "\u0410\u043d\u0433\u043e\u043b\u0430", "\u0410\u043d\u0442\u0430\u0440\u043a\u0442\u0438\u043a\u0430", "\u0410\u0440\u0433\u0435\u043d\u0442\u0438\u043d\u0430", "\u0410\u043c\u0435\u0440\u0438\u043a\u0430\u043d\u0441\u043a\u043e\u0435 \u0421\u0430\u043c\u043e\u0430", "\u0410\u0432\u0441\u0442\u0440\u0438\u044f", "\u0410\u0432\u0441\u0442\u0440\u0430\u043b\u0438\u044f", "\u0410\u0440\u0443\u0431\u0430", "\u0410\u043b\u0430\u043d\u0434\u0441\u043a\u0438\u0435 \u043e\u0441\u0442\u0440\u043e\u0432\u0430", "\u0410\u0437\u0435\u0440\u0431\u0430\u0439\u0434\u0436\u0430\u043d", "\u0411\u043e\u0441\u043d\u0438\u044f \u0438 \u0413\u0435\u0440\u0446\u0435\u0433\u043e\u0432\u0438\u043d\u0430", "\u0411\u0430\u0440\u0431\u0430\u0434\u043e\u0441", "\u0411\u0430\u043d\u0433\u043b\u0430\u0434\u0435\u0448", "\u0411\u0435\u043b\u044c\u0433\u0438\u044f", "\u0411\u0443\u0440\u043a\u0438\u043d\u0430-\u0424\u0430\u0441\u043e", "\u0411\u043e\u043b\u0433\u0430\u0440\u0438\u044f", "\u0411\u0430\u0445\u0440\u0435\u0439\u043d", "\u0411\u0443\u0440\u0443\u043d\u0434\u0438", "\u0411\u0435\u043d\u0438\u043d", "\u0411\u0435\u0440\u043c\u0443\u0434\u044b", "\u0411\u0440\u0443\u043d\u0435\u0439", "\u0411\u043e\u043b\u0438\u0432\u0438\u044f", "\u0411\u0440\u0430\u0437\u0438\u043b\u0438\u044f", "\u0411\u0430\u0433\u0430\u043c\u0441\u043a\u0438\u0435 \u041e\u0441\u0442\u0440\u043e\u0432\u0430", "\u0411\u0443\u0442\u0430\u043d", "\u041e\u0441\u0442\u0440\u043e\u0432 \u0411\u0443\u0432\u0435", "\u0411\u043e\u0442\u0441\u0432\u0430\u043d\u0430", "\u0411\u0435\u043b\u043e\u0440\u0443\u0441\u0441\u0438\u044f"]

Я везде указал кодировку utf-8, так что по идее всё должно работать

UPD: если пишу
print(country)
То выводится нормально

Вопрос задан более трёх лет назад
274 просмотра

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

Python-разработчик: расширенный курс + нейросети

12 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Профессия Python-разработчик + ИИ

10 месяцев

Далее

Решения вопроса 2

2 комментария

1 комментарий

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как при вызове хранимой процедуры получать значения RAISE NOTICE?
- 2 подписчика
- 13 апр.
- 209 просмотров
2

ответа
Python

+2 ещё

Простой
Почему не работает Selenium?
- 1 подписчик
- 09 апр.
- 218 просмотров
2

ответа
Python

Простой
В чем ошибка в использовании ft.ResponsiveView в данном коде?
- 1 подписчик
- 08 апр.
- 74 просмотра
1

ответ
Python

Простой
Можно ли указывать во flet heigh и width через проценты?
- 1 подписчик
- 02 апр.
- 104 просмотра
1

ответ
Python

Простой
Как правильно позиционировать элементы во flet?
- 1 подписчик
- 02 апр.
- 99 просмотров
1

ответ
Python

Простой
Почему может не отображаться страница во view(flet)?
- 1 подписчик
- 25 мар.
- 117 просмотров
1

ответ
Python

Средний
Asyncio + PySide6 + Telethon: список чатов и треды грузятся 30 минут — где искать причину?
- 2 подписчика
- 16 мар.
- 465 просмотров
2

ответа
Python

+2 ещё

Средний
Можно ли получить доступ к сайту?
- 3 подписчика
- 05 мар.
- 997 просмотров
4

ответа
Python

Простой
Как запретить удаление полей класса?
- 1 подписчик
- 27 февр.
- 322 просмотра
1

ответ
Python

Простой
Как написать правильный код Pyhton?
- 1 подписчик
- 22 февр.
- 546 просмотров
2

ответа
Показать ещё Загружается…

Python Developer

ITK academy • Краснодар

от 75 000 ₽

Python разработчик

DimaTech Ltd • Краснодар

от 140 000 до 140 000 ₽

Junior AI Automation Engineer / AI-инженер (junior)

OPENCITY • Москва

от 50 000 ₽

Answer 1 · 2021-06-02 13:24:48

Читай документацию на json.dump(), точнее на параметр ensure_ascii.

If ensure_ascii is true (the default), the output is guaranteed to have all incoming non-ASCII characters escaped. If ensure_ascii is false, these characters will be output as-is.

Answer 2 · 2021-06-02 13:30:16

soremix @SoreMix Куратор тега Python

yellow

dump(country, file, ensure_ascii=False)

Ответ написан более трёх лет назад

1 комментарий

Почему слетает кодировка?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт