Как превратить то что вернет WM_CHAR в юникод?

Question

Recardo_Recoly @Recardo_Recoly

C++

Как превратить то что вернет WM_CHAR в юникод?

Есть WndProc и в нем есть обработка WM_CHAR.
Только если перевести код символа который оно выдает то будет кракозявра. (это если русская раскладка)

А код русских букв вообще с 1к начинается.

Как это пофиксить ?

Вопрос задан более трёх лет назад
498 просмотров

2 комментария

Подписаться 1 Простой 2 комментария

Помогут разобраться в теме Все курсы

Нетология

Разработчик на C++

12 месяцев

Далее
Академия Эдюсон

Разработчик игр на Unreal Engine + ИИ

9 месяцев

Далее
Stepik

Профессия: Разработчик C++ (Junior)

2 месяца

Далее

Решения вопроса 1

33 комментария

Recardo_Recoly @Recardo_Recoly Автор вопроса

1) На WM_UNICHAR нулевая реакция.
2) Мне надо не массив Char а код символа.
Как на скрине... Код 1099 = символу 'ы'

Написано более трёх лет назад
Mercury13 @Mercury13

Recardo_Recoly, Говоришь, нулевая? Я не в курсе, как система будет работать с кодами более 65535. То ли разобьёт на два исполнения, то ли заглючит, то ли пропустит.
Пока не получается сделать это в Qt, и на это есть баг. Попробую напрямую на WinAPI, но это сложно будет

Написано более трёх лет назад
Recardo_Recoly @Recardo_Recoly Автор вопроса

Mercury13, Я так понял мне надо из кода Unicode 16 превратить в Unicode 32.
Мне просто надо чтобы WM_CHAR вернул код символа на том языке который сейчас включен или конвертировать результат WM_CHAR в такой код.
(под кодом я имею введу номер символа. То есть если написать (char)21 то оно превратит 21 в символ который он означает. У меня тоже самое только с русскими символами. А там число в пределах 1000. Но WM_CHAR возвращает в пределах 200. С английской все то работает но другой язык = белеберда.)

Написано более трёх лет назад
Mercury13 @Mercury13

Recardo_Recoly, Странно. Придётся ставить Delphi для проверки. Qt не получается.

Написано более трёх лет назад
Mercury13 @Mercury13

Не может быть, чтобы при нажатии «ы» выдавало 11000110.

Написано более трёх лет назад
Recardo_Recoly @Recardo_Recoly Автор вопроса

Mercury13, www.rapidtables.com/code/text/ascii-table.htm
Вот в этом конвекторе выдает.
И если я пишу (wchar_t)1099 то у меня отображается буква ы.
А вот как сделать чтобы с клавиатуры вводить я не знаю.
Для этого мне и нужен конверт в код русского символа.
Ибо там дальше дофига кода идет и с несколькими байтами оно работать не будет.
Нужен именно код (int число) который отвечает за символ.

Написано более трёх лет назад
Mercury13 @Mercury13
Вот я написал прогу.
https://pastebin.com/TNd9nFeu
Никаких проблем, в консоль программы-запускалки идут нормальные юникоды.
Запускал под Qt с флагами сборки
QMAKE_CXXFLAGS += -municode QMAKE_LFLAGS += -municode
Написано более трёх лет назад
Recardo_Recoly @Recardo_Recoly Автор вопроса

Mercury13, А в DLL VISUAL STUDIO оно работать будет ?
Я QT не пользуюсь

Написано более трёх лет назад
Mercury13 @Mercury13

Recardo_Recoly, Это простая программа на WinApi, тут нет ничего Qt’шного.
Главное — понять, куда в IDE идёт содержимое консоли.

Написано более трёх лет назад
Recardo_Recoly @Recardo_Recoly Автор вопроса

Mercury13, case WM_CHAR:
std::cout << wParam << std::endl;
break;
Ты точно пробовал русские символы ?
У меня они выдают не то что я нажымаю

Написано более трёх лет назад
Mercury13 @Mercury13

Recardo_Recoly, Почему говорю «запускал под Qt» — разумеется, в оконной программе содержимое консоли идёт в никуда, потому что так устроена Windows. В IDE Qt Creator, в зависимости от настройки Run in terminal, этот идущий в никуда вывод перенаправляется или в особое консольное окно, или в Application Output. Главное — его можно увидеть, и это бесценно.

Написано более трёх лет назад
Mercury13 @Mercury13

Recardo_Recoly, Точно пробовал.

Написано более трёх лет назад
Recardo_Recoly @Recardo_Recoly Автор вопроса

Mercury13, А мне и надо в оконной программе.
Это DLL который инжектится в программу.

Написано более трёх лет назад
Mercury13 @Mercury13

Вот вторая прога, полностью лишённая юникода.
https://pastebin.com/ffrMt2eg
Там уже выходят однобайтовые коды — например, при нажатии «ы» выходит 251, (но не ваши 230).
Таким образом, причина вот в чём. Ваш фреймворк, в котором вы работаете (MFC?), имеет дело с однобайтовой кодировкой.

Написано более трёх лет назад
Recardo_Recoly @Recardo_Recoly Автор вопроса

Mercury13, Не выше 230 ? А как мне сделать из этого от 1000 с чем то ?

Написано более трёх лет назад
Mercury13 @Mercury13

Recardo_Recoly, Я сказал, что не ВАШИ 230. «ы» = 251, что вполне соответствует кодировке Win-1251.
Если окно ваше — сделать его юникодным. Если не ваше — использовать функцию Windows MultiByteToWideChar и смириться, что оно неюникодное.

Написано более трёх лет назад
Mercury13 @Mercury13

Recardo_Recoly, Что получилось? Действительно функции неюникодные и дают (скажем, в маленьких буквах русского алфавита) от 224 до 255?

Написано более трёх лет назад
Recardo_Recoly @Recardo_Recoly Автор вопроса

Mercury13, То куда этот код идет дальше просто не поймет такой код и подумает что это какая то кракозявра из хрен знает какого языка.
Там код от 1000 примерно.
И мне надо конвертнуть его так....

Написано более трёх лет назад
Mercury13 @Mercury13

Recardo_Recoly, Так я ничего и не понял.
Коды (для строчных) 1072…1103 — это Юникод, и эту кодовую позицию можно спокойно превращать в UTF-8.
Коды 224…255 (опять-таки, для строчных) — это однобайтовая.
Что у тебя?

Написано более трёх лет назад
Recardo_Recoly @Recardo_Recoly Автор вопроса

Mercury13, Мне надо как то получить из WM_CHAR вот как раз этот код который "1072…1103 — это Юникод" но все методы конверта в UTF 8 возвращают (те что я находил) wstring и как я понял там символ записан 2 и больше байтами.
А как мне получить именно число в int переменную.
Если там буква а то ее код будет 1072.
Вот как сделать чтобы из того что WM_CHAR вернет при нажатии кнопки а (при русской раскладке) вернуло код 1072 и так со всеми кнопками

Написано более трёх лет назад

Mercury13 @Mercury13

А что даёт WM_CHAR?
Если однобайтовую — то используй системную MultiByteToWideChar.

void str::a2w(
        std::wstring& rW,
        const std::string& aA)
{
#ifdef _WIN32
    rW.resize(MultiByteToWideChar(
            CP_ACP, 0,
            aA.c_str(), aA.length(),
            NULL, 0));
    MultiByteToWideChar(
            CP_ACP, 0,
            aA.c_str(), aA.length(),
            const_cast<wchar_t*>(rW.data()), rW.length());
#else
    rW.resize(aA.length()+1);
    size_t n = mbstowcs(const_cast<wchar_t*>(rW.data()), aA.c_str(), aA.length());
    rW.resize(n);
#endif
}

Написано более трёх лет назад

Mercury13 @Mercury13

Recardo_Recoly, Я не видел вашего кода.
Я не знаю, кто создавал окно и какими функциями.
Я даже не знаю, соответствуют 230 и 1099 одной букве или нет.

Написано более трёх лет назад
Recardo_Recoly @Recardo_Recoly Автор вопроса

Mercury13, Ну в этом примере что ты дал таже фигня что и везьде конвертится из string в wstring а как конвертить из int кода символа utf-16 (если не ошибаюсь именно utf16 будет возвращаеть WM_CHAR из WndProc).
в int код символа utf8 ?

Написано более трёх лет назад
Mercury13 @Mercury13

Recardo_Recoly, Хорошо. Нажми маленькое «ы» и скажи, какой код возвращается.
Я ДАЖЕ НЕ ЗНАЮ, соответствуют 230 и 1099 одной букве или нет.

Написано более трёх лет назад
Recardo_Recoly @Recardo_Recoly Автор вопроса

WM_CHAR вернет 251
Должно быть 1099

Написано более трёх лет назад

Mercury13 @Mercury13

Recardo_Recoly, Однобайтовая кодировка.

void str::a2w(
        std::wstring& rW,
        const std::string& aA)
{
#ifdef _WIN32
    rW.resize(MultiByteToWideChar(
            CP_ACP, 0,
            aA.c_str(), aA.length(),
            NULL, 0));
    MultiByteToWideChar(
            CP_ACP, 0,
            aA.c_str(), aA.length(),
            const_cast<wchar_t*>(rW.data()), rW.length());
#else
    rW.resize(aA.length()+1);
    size_t n = mbstowcs(const_cast<wchar_t*>(rW.data()), aA.c_str(), aA.length());
    rW.resize(n);
#endif
}

Написано более трёх лет назад

Recardo_Recoly @Recardo_Recoly Автор вопроса

Mercury13, const std::string& aA
А как мне превратить int код в string ?

Написано более трёх лет назад
Mercury13 @Mercury13

Recardo_Recoly,
s += static_cast<char>(code);

Написано более трёх лет назад
Recardo_Recoly @Recardo_Recoly Автор вопроса

Mercury13, Уррааааааааааааааааааааааааааааааааааааааа :3
Работает)))
Спасибо вам огромное :3
СЯБКИ)

Написано более трёх лет назад
Mercury13 @Mercury13

Recardo_Recoly, Последнее слово. Однобайтовая кодировка — это плохо, и терпима она, ЕСЛИ ОКНО ЧУЖОЕ. Если вы сами сделали однобайтовое окно — думайте над тем, как его сделать юникодным.

Написано более трёх лет назад
Recardo_Recoly @Recardo_Recoly Автор вопроса

Mercury13, Это мод для игры. Окно создает игра а я подадаю в процесс уже после его создания.
Через инжект

Написано более трёх лет назад
Mercury13 @Mercury13

Recardo_Recoly, Старая, наверно, цяця.

Написано более трёх лет назад
Recardo_Recoly @Recardo_Recoly Автор вопроса

Mercury13, GTA SA)

Написано более трёх лет назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C++

Простой
Нарушается ли тут strict aliasing rule?
- 1 подписчик
- вчера
- 40 просмотров
1

ответ
C++

Простой
Безопасно ли преобразование reinterpret_cast из указателя в массив?
- 1 подписчик
- 18 июл.
- 45 просмотров
1

ответ
C++

Простой
Как сделать скриншот второго монитора на С++?
- 1 подписчик
- 14 июл.
- 122 просмотра
4

ответа
C++

Простой
Возможно ли сделать скрин действующего окна через Alt + PrtSc на С++?
- 1 подписчик
- 08 июл.
- 138 просмотров
2

ответа
C++

Простой
Как можно через ООП сериализировать в разные форматы в едином стиле?
- 2 подписчика
- 07 июл.
- 104 просмотра
3

ответа
C++

+1 ещё

Простой
Почему компилятор подчёркивает импортируемый класс как ошибку «индификатор не определён»?
- 1 подписчик
- 04 июл.
- 117 просмотров
2

ответа
C++

Сложный
Концепт проверки совместимости с шаблонным конструктором?
- 1 подписчик
- 25 июн.
- 102 просмотра
1

ответ
C++

Простой
Я единственный у кого cppreference.com через раз падает с ERR_TIMED_OUT?
- 1 подписчик
- 21 июн.
- 194 просмотра
2

ответа
C++

+1 ещё

Простой
Как правильно посчитать UV координаты из локальных нормальных?
- 1 подписчик
- 20 июн.
- 113 просмотров
1

ответ
C++

+3 ещё

Простой
Почему бинарник скомпилированный через CMake весит больше, чем напрямую скомпилированный через clang++?
- 1 подписчик
- 11 июн.
- 344 просмотра
1

ответ
Показать ещё Загружается…

Mercury13, Как конвертнуть символ из UTF 16 to UTF 8 при этом чтобы это был код символа в иникоде. Ибо wParam равен какому то бреду если пытатся русские символы получать через WM_CHAR в WindProc

Answer 1 · 2017-09-27 22:19:53

Recardo_Recoly,
Понятно.
1. Лучше использовать WM_UNICHAR, он работает и с кодами более 65535. Поддерживается как минимум WinXP.
2. Как превратить кодовую позицию в UTF-8, есть много вариантов. Сейчас найду свой.

enum {
    SURROGATE_MIN = 0xD800,
    SURROGATE_MAX = 0xDFFF,
    SURROGATE_LO_MIN = SURROGATE_MIN,
    SURROGATE_HI_MIN = 0xDC00,
    SURROGATE_LO_MAX = SURROGATE_HI_MIN - 1,
    SURROGATE_HI_MAX = SURROGATE_MAX,
    UNICODE_MAX = 0x10FFFF,
    U8_1BYTE_MAX = 0x7F,
    U8_2BYTE_MIN = 0x80,
    U8_2BYTE_MAX = 0x7FF,
    U8_3BYTE_MIN = 0x800,
    U8_3BYTE_MAX = 0xFFFF,
    U8_4BYTE_MIN = 0x10000,
    U8_4BYTE_MAX = UNICODE_MAX,
    U16_1WORD_MAX = 0xFFFF,
    U16_2WORD_MIN = 0x10000,
    U16_2WORD_MAX = UNICODE_MAX,
};

void str::putCpNe (char*& p, unsigned long aCp)
{
    if (aCp <= U8_2BYTE_MAX) {  // 1 or 2 bytes, the most frequent case
        if (aCp <= U8_1BYTE_MAX) {  // 1 byte
            *(p++) = static_cast<char>(aCp);
        } else { // 2 bytes
            *(p++) = static_cast<char>((aCp >> 6)   | 0xC0);
            *(p++) = static_cast<char>((aCp & 0x3F) | 0x80);
        }
    } else {  // 3 or 4 bytes
        if (aCp <= U8_3BYTE_MAX) {  // 3 bytes
            *(p++) = static_cast<char>( (aCp >> 12)        | 0xE0);
            *(p++) = static_cast<char>(((aCp >> 6) & 0x3F) | 0x80);
            *(p++) = static_cast<char>( (aCp       & 0x3F) | 0x80);
        } else {    // 4 bytes
            *(p++) = static_cast<char>(((aCp >> 18) & 0x07) | 0xF0);
            *(p++) = static_cast<char>(((aCp >> 12) & 0x3F) | 0x80);
            *(p++) = static_cast<char>(((aCp >> 6)  & 0x3F) | 0x80);
            *(p++) = static_cast<char>( (aCp        & 0x3F) | 0x80);
        }
    }
}

void str::appendCp(std::string & s, unsigned long aCp)
{
    char c[5];
    char* end = c;
    putCpNe(end, aCp);
    s.append(c, end);
}

Слово Cp у меня означает code point, кодовая позиция Юникода. Ne — no error-checking, без проверки кодовых позиций на корректность.

В Си++ есть и штатные функции преобразования кодовых позиций Юникода в UTF-8 и UTF-16. Но страшны, как чёрт, и половина из них в C++17 deprecated :(

И последнее, что я хочу сказать.
Вы путаете две вещи: Юникод и его кодовые позиции, и форматы записи юникодных строк UTF-8 и UTF-16. Соотношение «один символ Юникода — один char» только в UTF-32!

Как превратить то что вернет WM_CHAR в юникод?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт