phpusr
@phpusr
Программист, велосипедист, бегун

Как расшифровать русские слова в PDF-файле?

Используя библиотеку pdfbox-1.8.2 для Java, читаю файлы электронных ЖД билетов, для получения оттуда информации.

Но вот появился новый формат билетов, в котором, после парсинга в текстовый файл, английские слова читаются нормально, а русские получаются в виде крякозябр.

Способы, перечисленные здесь, испробовал, не помогло.

Можно ли расшифровать русские слова в таком файле, или в нем отсутствует текстовая информация русских слов?

Пример PDF-файла
Пример текстового файла
  • Вопрос задан
  • 2892 просмотра
Решения вопроса 1
phpusr
@phpusr Автор вопроса
Программист, велосипедист, бегун
Решение найдено тут.
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
26 апр. 2024, в 09:18
500 руб./в час
26 апр. 2024, в 06:46
1500 руб./в час
26 апр. 2024, в 05:31
1000 руб./за проект