Задать вопрос
@immelnikoff
Изучаю БД

Есть ли где-нибудь в доступе информация о частоте использования отдельных символов unicode в разных стилях текста и на разных языках?

Нужно оценить степень "мёртвости" отдельных символов кодировки cp1251.
  • Вопрос задан
  • 64 просмотра
Подписаться 1 Средний Комментировать
Пригласить эксперта
Ответы на вопрос 1
@dmshar
1. Какое отношение Unicode имеет к кодировке ср1251? (Подсказка ср1251 - 8-битная кодировка, Unicode - как минимум 16-битная)
2. Какое отношение к "разным языкам" имеет ср1251(Подсказка ср1251 - кирилическая, а по сути - русскоязычная кодировка)
3. Что означает "мертвость" символа? Ну например, символ "~" почти мертвый. И это не зависит ни от стиля текста, ни от языка.
4. Современный вариант Unicode (по состоянию на май 2019) содержит 137 994 символов. Как ві себе представляете таблицу с частотой их использования?
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы