phpusr
@phpusr
Программист, велосипедист, бегун

Как расшифровать русские слова в PDF-файле?

Используя библиотеку pdfbox-1.8.2 для Java, читаю файлы электронных ЖД билетов, для получения оттуда информации.

Но вот появился новый формат билетов, в котором, после парсинга в текстовый файл, английские слова читаются нормально, а русские получаются в виде крякозябр.

Способы, перечисленные здесь, испробовал, не помогло.

Можно ли расшифровать русские слова в таком файле, или в нем отсутствует текстовая информация русских слов?

Пример PDF-файла
Пример текстового файла
  • Вопрос задан
  • 2902 просмотра
Решения вопроса 1
phpusr
@phpusr Автор вопроса
Программист, велосипедист, бегун
Решение найдено тут.
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы