Используя библиотеку
pdfbox-1.8.2 для Java, читаю файлы электронных ЖД билетов, для получения оттуда информации.
Но вот появился новый формат билетов, в котором, после парсинга в текстовый файл, английские слова читаются нормально, а русские получаются в виде
крякозябр.
Способы, перечисленные
здесь, испробовал, не помогло.
Можно ли расшифровать русские слова в таком файле, или в нем отсутствует текстовая информация русских слов?
Пример PDF-файлаПример текстового файла