Есть куча реальных кейсов когда приходиться идти в разрез академическим подходам.
Все определяется требованиям к объему хранимых данных ,
скорости их обработки, потоку новых / обновляемых данных в секунду времени.
1. Какое отношение Unicode имеет к кодировке ср1251?
2. Какое отношение к "разным языкам" имеет ср1251(Подсказка ср1251 - кирилическая, а по сути - русскоязычная кодировка)
3. Что означает "мертвость" символа? Ну например, символ "~" почти мертвый. И это не зависит ни от стиля текста, ни от языка.
4. Современный вариант Unicode (по состоянию на май 2019) содержит 137 994 символов. Как ві себе представляете таблицу с частотой их использования?