Задать вопрос
@OldJohn

Java кодировки из windows-1251 в utf-8?

Почему английские буквы кодируются и декодируются в windows-1251 и utf8 соответственно корректно, а русские символы нет?
Ведь если и та и другая кодировка использует юникод, то в обеих кодировках и латинице и кириллице соответствуют одни и те же кодпойнты.
  • Вопрос задан
  • 351 просмотр
Подписаться 1 Простой Комментировать
Решения вопроса 1
@Akela_wolf
Extreme Programmer
windows-1251 не использует unicode. Это старая кодировка, из тех времен, когда юникода еще даже не существовало (наряду с cp866, koi-8r и другими)

Латиница же работает потому что кодовые таблицы для латиницы в ASCII, windows-1251 и utf-8 совпадают (то есть один и тот же символ кодируется одним и тем же числом из диапазона 0-127)
А для кириллицы - нет, числа кодирующее кириллический символ в windows-1251 и в utf-8 разные (если точнее, то в windows-1251 это будет одно число, а в utf-8 - пара чисел)
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы