Добавлю свой вариант.
Наткнулся на сервис от Мультитран -
www.multitran.ru/c/m.exe
На пробу скопировал и вставил текст из "Короленко В. Дети подземелья.fb2"
В итоге получил "Статистика для текста". Всего слов - 12670. Это с союзами типа "и" - 521 раз и не убранными переносами.
Отфильтровывать слова от можно и глазами, наиболее популярным вышли слова "она" - 166,
"мой" - 80, "все" - 68, "отец" - 65, "ты" - 64, "когда" - 63, "быть" - 62, "рука" - 59.
Кое уже можно представить о содержании. Вполне сносно, если учесть, что никаких знаний языков не требуется.