Задача убрать мултибайтовые символы из материала
Базу символов юникода, я не нашел.
Когда конвертирую кодировкуНормализация никак не может влиять на кодировку, как и кодировка на нормализацию, она применяется к сырым кодюнитам.
Можно немного подробнее: Lu, Li, Mn?Это категории символов из UnicodeDatabase: uppercase, lowercase и nonspacing mark (та самая диакритика).
$ pacaur -Ss jdk | grep -A1 'jdk.*8.*src'
extra/openjdk8-src 8.u131-1
OpenJDK Java 8 sources
--
aur/openjdk8-jetbrains-src 8.u152.b837.4-1 (8, 1,27)
OpenJDK Java 8 sources (with JetBrains patches)
man systemd.service