Как преобразовать char* содержащий символы unicode?

Question

Skodio29 @Skodio29

C++

Как преобразовать char* содержащий символы unicode?

Добрый день.
Есть внешняя C библиотека которая возвращает char* данные.
Например, "name":"\u0422\u0420\u0415\u041d\u0414".

Необходимо получить сконвертированные символы, т.е. на выходе иметь "name": "Флоренция".
Я пробовал преобразовывать из char* в std::string, а далее через MultiByteToWideChar в std::wstring, но это не приносит ожидаемого результата.

Работа с консолью не ведется.
Сейчас если \uXXXX нет, то char перегоняется в char16_t и отдается.
codecvt_utf8_utf16 deprecated поэтому даже не пробовал.

Вопрос задан более двух лет назад
248 просмотров

1 комментарий

Подписаться 1 Простой 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Разработчик на C++: Профессия + специализация + нейросети

12 месяцев

Далее
Skillbox

Разработчик на C++

7 месяцев

Далее
Яндекс Практикум

Разработчик C++

9 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 2

1 комментарий

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C++

Простой
Какой контейнер выбрать для поиска по ключу для разных размеров?
- 2 подписчика
- 14 дек.
- 136 просмотров
0

ответов
C++

+2 ещё

Простой
Как прочитать данные из пайпа в C++ не перепутав с TTY stdin?
- 1 подписчик
- 14 дек.
- 80 просмотров
1

ответ
C++

Простой
Почему function wrapper с ссылкой в сигнатуре может принимать pointer to member function?
- 1 подписчик
- 11 дек.
- 74 просмотра
0

ответов
C++

Простой
Как лучше реализовать асинхронную задержку?
- 2 подписчика
- 04 дек.
- 211 просмотров
2

ответа
C++

+2 ещё

Простой
Как скомпилировать рабочую dll библиотеку?
- 3 подписчика
- 26 нояб.
- 329 просмотров
1

ответ
C++

+1 ещё

Простой
Как узнать, хранятся числа в компьютере в прямом, дополнительном или обратном коде?
- 1 подписчик
- 23 нояб.
- 472 просмотра
6

ответов
C++

+1 ещё

Средний
Имя массива это адрес первого элемента или указатель на его первый элемент в Си?
- 2 подписчика
- 12 нояб.
- 485 просмотров
5

ответов
C++

+1 ещё

Простой
Почему Project Dependencies не работает?
- 1 подписчик
- 10 нояб.
- 100 просмотров
1

ответ
C++

Простой
Влияет ли, передаёшь ты в функцию аргументы по ссылке или по значению, на производительность и память?
- 2 подписчика
- 07 нояб.
- 364 просмотра
2

ответа
C++

Простой
А нужно ли заменять dynamic_cast?
- 1 подписчик
- 07 нояб.
- 119 просмотров
1

ответ
Показать ещё Загружается…

Разработчик бэкенда в команду коммуникационной платформы

Яндекс • Москва

от 300 000 до 490 000 ₽

Java Developer

ИТРУМ • Ростов-на-Дону

от 75 000 ₽

nestjs backend developer

instat

от 120 000 до 240 000 ₽

Это - текстовый файл? Или properties? Или json.

"name":"\u0422\u0420\u0415\u041d\u0414"

Я к чему спрашиваю. Может ASCIIZ + Escape кодирование выбрано правильно?

Answer 1 · 2023-12-04 17:50:57

Если я правильно понял чего выхотите добиться, то можете попробовать данную библиотеку https://github.com/nemtrif/utfcpp
Крайне простая и компактная

Answer 2 · 2023-12-04 20:36:16

Вам надо \uXXXX преобразовать в char16_t? Можно это руками делать. Берете по 6 байт из строки. Последние 4 руками преобразуете из 16ричной системы. Если символ от a до f, то прибавляете к нему 10-'a'. Если от 0 до 9 - 0-'0'.

Удобно это циклом делать, сдвигая ответ на 4 бита влево и прибавляя новый символ:

std::wstring Parse(const std::string encoded) {
  std::wstring result;
  for (int start = 0; start < encoded.length(); start += 6) {
    if (encoded[start] != '\\' || encoded[start+1] != 'u') return result // строка неправильного формата.
    char16_t nxt = 0;
    for (int i = start +2; i < start+6; ++i) {
      int cur = 0;
      char &chr = encoded[i];
      if ('0' <= chr && chr <= '9') cur = chr - '0';
      if ('a' <= chr && chr <= 'f') cur = chr - 'a' + 10;
      if ('A' <= chr && chr <= 'F') cur = chr - 'A' + 10;
      nxt = (nxt << 4) + cur;
    }
    result += nxt;
  }
  return result;
}

Как преобразовать char* содержащий символы unicode?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт