Задать вопрос
@sddvxd

Почему ascii и utf-8 тексты имеют разную длину?

Добрый день!
Есть бинарный файл в кодировке ansi, я копирую его в файл с кодировкой utf-8, причем первый файл размером 7168 байт, а второй (куда скопировал текст) становится размером 7 736 байт. Одинаковое количество и порядок дали почему-то разный размер. Объясните пожалуйста - почему
  • Вопрос задан
  • 872 просмотра
Подписаться 1 Простой 4 комментария
Пригласить эксперта
Ответы на вопрос 2
SagePtr
@SagePtr
Еда - это святое
Бинарный? Перекодируете? Не ждите, что он после этого останется бинарным.
Ответ написан
В UTF-8 символы соответствующие ASCII кодируются одним октетом, но символы других кодовых страниц - различным количеством октет (от 2 до 4х в настоящее время), например кириллические символы или символы специфичные для европейских языков - 2мя октетами.

В ANSI-кодировках символы всегда кодируются одним октетом, и ANSI-кодировка может содержать не только ASCII-символы.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы