Имеется легкая программа на Python 2, которая проходит по одному файлу с русскими словами и добавляет их в коллекцию, потом эта коллекция записывается в json файл
f = open("in.txt")
conversations = open("data/russian/conversations.json", "wb")
ar = {"conversations": []}
worker = []
for line in f:
if line == "-----":
ar["conversations"].append(worker)
worker = []
else:
worker.append(line.strip())
print ar["conversations"][0][0]
conversations.write(str(ar))
conversations.close()
В итоге в json файле я имею что-то подобное:
{'conversations': [['\xd0\x9f\xd1\x80\xd0\xb8\xd0\xb2\xd0\xb5\xd1\x82!', '\xd0\x97\xd0\xb4\xd1\x80\xd0\xb0\xd0\xb2\xd1\x81\xd1\x82\xd0\xb2\xd1\x83\xd0\xb9!', // и так далее
Вопрос заключается в следующем: как корректно выводить русские символы в файл? (.encode("utf-8") пытался, не помогло)