Задать вопрос

phpusr

Сергей @phpusr

Программист, велосипедист, бегун

pdf

Как расшифровать русские слова в PDF-файле?

Используя библиотеку pdfbox-1.8.2 для Java, читаю файлы электронных ЖД билетов, для получения оттуда информации.

Но вот появился новый формат билетов, в котором, после парсинга в текстовый файл, английские слова читаются нормально, а русские получаются в виде крякозябр.

Способы, перечисленные здесь, испробовал, не помогло.

Можно ли расшифровать русские слова в таком файле, или в нем отсутствует текстовая информация русских слов?

Пример PDF-файла
Пример текстового файла

Вопрос задан более трёх лет назад
2912 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillbox

Профессия 1С-программист

8 месяцев

Далее

Решения вопроса 1

phpusr

Сергей @phpusr Автор вопроса

Программист, велосипедист, бегун

Решение найдено тут.

Ответ написан более трёх лет назад

Комментировать

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Браузеры

+1 ещё

Простой
Как вернуть кодировку страниц?
- 1 подписчик
- 09 апр.
- 140 просмотров
2

ответа
PHP

+2 ещё

Простой
Как сконвертировать файл в формате excel в pdf?
- 4 подписчика
- 14 нояб. 2025
- 539 просмотров
4

ответа
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт. 2025
- 230 просмотров
0

ответов
Windows

+1 ещё

Простой
Как вернуть встроенный предпросмотр PDF в Windows?
- 2 подписчика
- 25 окт. 2025
- 4722 просмотра
3

ответа
PDF

+1 ещё

Простой
Как в PDF поставить штамп или сделать визуализацию ЭП при трехстороннем и более подписании?
- 2 подписчика
- 25 сент. 2025
- 2931 просмотр
5

ответов
Windows

+4 ещё

Простой
Существует ли виртуальный PDF принтер со встроенным эффектом сканера?
- 4 подписчика
- 24 сент. 2025
- 5750 просмотров
2

ответа
PDF

Простой
Есть ли альтернатива wkhtmltopdf?
- 1 подписчик
- 28 июл. 2025
- 204 просмотра
2

ответа
Docker

+1 ещё

Простой
Как установить wkhtmltopdf на ларавель?
- 1 подписчик
- 28 июл. 2025
- 174 просмотра
1

ответ
Python

+3 ещё

Простой
Извлечение таблиц со спецификациями из PDF чертежей металлоконструкций — решаемо? Или я встрял?
- нет подписчиков
- 23 июн. 2025
- 496 просмотров
2

ответа
PDF

Простой
PDF Стилер (Или вредоносный код) возможно?
- 1 подписчик
- 06 июн. 2025
- 281 просмотр
1

ответ
Показать ещё Загружается…

PHP и Node.js разработчик

TripShock Adventures

от 1 000 до 2 500 $

Golang Developer

Правое полушарие Интроверта

от 200 000 до 300 000 ₽

Системный архитектор

ГК «ЭФКО» • Москва

До 360 000 ₽