Если
(на крайняк подойдет что угодно другое), то расскажу как это работает:
Берем текст, разбиваем его на слова, и несколько первых ищем в разных кодировках в
ispell-dictionaries. Как только пару слов совпало — профит.
Есть несколько улучшений к идее.
1) используем только первые 6 букв слова.
2) используем данные
частотного анализа для получения отсортированного списка преобразований кодировок.
3) используем цепи для списка кодировок (ищем часто встречающиеся слоги).