Ответы пользователя по тегу ASCII
  • Кодировки в PC?

    Moskus
    @Moskus
    Компьютеры вообще ничего сами не понимают, никогда.
    У некоторых типов файлов кодировка определяется их форматом, потому программы, которые с ними работают, всегда используют нужную кодировку.
    У других типов файлов кодировка указывается в заголовке. Например, в HTML для этого есть тег. Так что программы читают его содержимое и интерпретируют кодировку верно.
    Таблицы кодировок никуда не "зашиты". Они могут быть частью операционной системы, могут - частью того или иного софта.
    Когда происходит ввод с клавиатуры, ASCII тут не при чем. Операционная система получает скан-код клавиши, а дальше генерирует символ в соответствии с тем, какая раскладка клавиатуры включена в данный момент. При этом, в какой код одного и того же символа это превращается, также зависит от конкретной программы. Например, если в этот момент открыта командная строка, а в ней установлена кодовая страница 866, символ кириллицы превратится в два байта из таблицы символов 866. А если открыт Word, то превратится в символ Unicode из более чем двух байт.
    Ответ написан
  • Как влияет переход от кириллицы в латиницу на IT-индустрию страны?

    Moskus
    @Moskus
    Нет никаких практических плюсов. Есть только гигантский геморрой переходного периода, на котором, определенно, наживутся отдельные IT-компании. Использование ASCII неизбежно потребует многобуквенных комбинаций, а это - худшее, что можно придумать.
    Ответ написан
  • Как вручную добавлять диакритические знаки к буквам?

    Moskus
    @Moskus
    Это весьма двоякая ситуация. Хотя в некоторых случаях (например, так происходит в Mac OS) такие символы действительно комбинируются из двух, но это может создавать проблемы софту, который ориентирован на применение "готовых", а не "комбинированных" символов. Эта проблема может возникать и при поиске, когда "комбинированная" ё не считается за эквивалент одиночной, и так далее.
    Ну а само по себе составление таких знаков работает очень просто.
    В Unicode есть блоки Combining Diacritical Marks и Combining Diacritical Marks Supplement.
    Если один из таких символов следует за символом буквы, они "комбинируются". Например, ё может быть составлена как U+0435 следующий за ней U+0308. Вместе получится ё .
    С символом ø (o with stroke) - сложнее. Этот символ не представляется комбинацией двух символов, хотя знак перечеркивания существует среди CDM, это символ с кодом U+0338, но это другое перечеркивание - long solidus overlay. Как можно видеть, он не дает нужного эффекта: o̸
    Ответ написан