Добрый день!
Есть бинарный файл в кодировке ansi, я копирую его в файл с кодировкой utf-8, причем первый файл размером 7168 байт, а второй (куда скопировал текст) становится размером 7 736 байт. Одинаковое количество и порядок дали почему-то разный размер. Объясните пожалуйста - почему
- нонсенс. Если уж файл бинарный, то к нему неприменимо понятие "кодировка". И уточните, каким способом копируете, пока довольно туманно сформулировано.
Upd. вообще для ответа на ваш вопрос достаточно сделать побайтовое сравнение (есть программки), сразу будет видно отличия. Подозреваю, что дело в CR LF.
я ничего не перекодирую. просто открываю файл текстовым редактором, а он мне дает представление в той кодировке, которой решит. проблем с копированием не возникает
В UTF-8 символы соответствующие ASCII кодируются одним октетом, но символы других кодовых страниц - различным количеством октет (от 2 до 4х в настоящее время), например кириллические символы или символы специфичные для европейских языков - 2мя октетами.
В ANSI-кодировках символы всегда кодируются одним октетом, и ANSI-кодировка может содержать не только ASCII-символы.