Как прочитать на С++ Unicode файл с русским текстом?

Question

rust21 @rust21

Unicode

Как прочитать на С++ Unicode файл с русским текстом?

Всем привет) Возникла задача читать Unicode файлы с содержимым на русском языке. Для решения задачи создал тестовый файл в Блокноте, заполнил его русским текстом и сохранил как Unicode. После пытался его прочитать следующими способами:
1)

std::wstring readUtf16(const std::string &filename) {

    std::ifstream file(filename.c_str());
    std::stringstream ss;
    ss << file.rdbuf() << '\0';
    return std::wstring((wchar_t*)ss.str().c_str());
}

Где-то в программе:

std::wstring ws = readUtf16("test.txt");

    std::string s(ws.begin(),ws.end());
    std::cout << s.size() << " "<< s;

Данный способ выводит правильную длину строки s, но в консоль выводит кракозябры (вставить в начале setlocale пробовал)

2) Пытался использовать подход с использованием wstring и wchar_t при помощь wifstream. Эффекта ноль вообще (в консоль не выводится ничего).

3) Пытался использовать кодеры из codecvt следующим образом:

const std::locale utf16_locale_in = std::locale(std::locale::empty(),
                                                new std::codecvt_utf8_utf16<wchar_t>());
    {
        std::wifstream input("test.txt");
        std::wstring ws;
        input.imbue(utf16_locale_in);
        std::getline(input,ws);
        std::wstring_convert<std::codecvt_utf8_utf16<wchar_t>,wchar_t> converter;
        std::string s = converter.to_bytes(ws);
        std::cout << s << " " << s.size();
    }

Эффекта опять же ноль. Проблем с чтением английского текста не возникало. Прошу помощи у знающих людей.

Вопрос задан более трёх лет назад
2897 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

JavaScript

+4 ещё

Сложный
Почему в WebSockets History в Burp Suite отображаются кракозябры?
- 1 подписчик
- более года назад
- 246 просмотров
2

ответа
C#

+1 ещё

Средний
Что делать когда при конвертации из utf8 в string я получаю (string)\0\0\0 и так далее?
- 1 подписчик
- более года назад
- 153 просмотра
1

ответ
Python

+2 ещё

Простой
Почему хранимая процедура MySQL не принимает кириллицу?
- 3 подписчика
- более года назад
- 180 просмотров
1

ответ
Python

+1 ещё

Простой
Как декодироавать строку без искажений?
- 1 подписчик
- более двух лет назад
- 130 просмотров
1

ответ
WordPress

+1 ещё

Простой
Как в Wordpress запретить менять вид спецсимволов?
- 1 подписчик
- более двух лет назад
- 81 просмотр
1

ответ
C

+1 ещё

Средний
Как реализовать кроссплатформенную поддержку Unicode в аргументах командной строки в C?
- 1 подписчик
- более двух лет назад
- 226 просмотров
2

ответа
Linux

+2 ещё

Простой
Почему некорректно выводятся символы utf-8 в linux?
- 1 подписчик
- более двух лет назад
- 243 просмотра
3

ответа
YouTube

+2 ещё

Простой
Почему происходит частичная конвертация в юникод?
- 1 подписчик
- более двух лет назад
- 93 просмотра
0

ответов
Flask

+1 ещё

Простой
Как исправить ошибку декодирования UTF-8 в Python?
- 1 подписчик
- более трёх лет назад
- 537 просмотров
1

ответ
Node.js

+2 ещё

Простой
Как пропустить китайские иероглифы через регулярку?
- 1 подписчик
- более трёх лет назад
- 646 просмотров
2

ответа
Показать ещё Загружается…

Answer 1 · 2015-04-05 14:29:30

у меня вот так работает:
std::ifstream f("/temp/u.txt", std::ifstream::binary);
f.seekg(0, f.end);
int size = f.tellg();
f.seekg(0, f.beg);
std::u16string us1;
us1.resize(size / 2);
f.read((char*)&us1[0], 2 * us1.length());
// us1 теперь содержит utf16 строку

Как прочитать на С++ Unicode файл с русским текстом?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт