Задать вопрос
@vrazbros

Почему кирилица занимает по 2 байта на символ в utf8?

Почему кириллица занимает по 2 байта на символ в utf8 ?
  • Вопрос задан
  • 8409 просмотров
Подписаться 1 Простой 1 комментарий
Пригласить эксперта
Ответы на вопрос 2
@MaksPaverov
UTF-8 (от англ. Unicode Transformation Format, 8-bit — «формат преобразования Юникода, 8-битный») — одна из общепринятых и стандартизированных кодировок текста, которая позволяет хранить символы Юникода, используя переменное количество байт (от 1 до 6).

ОТ 1 до 6 БАЙТ (каждый из которых 8 БИТ)
Зависит от символа, русские занимают 2 байта
Ответ написан
Комментировать
https://ru.wikipedia.org/wiki/UTF-8
https://ru.wikipedia.org/wiki/%D0%AE%D0%BD%D0%B8%D...
https://ru.wikipedia.org/wiki/%D0%9A%D0%B8%D1%80%D...
Потому, что в юникоде под кириллицу выделили 5 блоков двухбайтового диапазона.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы