Задача убрать мултибайтовые символы из материала
Базу символов юникода, я не нашел.
Когда конвертирую кодировкуНормализация никак не может влиять на кодировку, как и кодировка на нормализацию, она применяется к сырым кодюнитам.
Можно немного подробнее: Lu, Li, Mn?Это категории символов из UnicodeDatabase: uppercase, lowercase и nonspacing mark (та самая диакритика).