Как копировать текс с PDF?

Question

Demigodd @Demigodd

Как копировать текс с PDF?

Есть pdf файл, при открытий текст отображаеться Русским, копирую текст через Ctrl+C при вставке выдает непонятные символы.

Пример`
1)Издательство: J.-fanareJibCTBo
2)полиграфии и книжной торговли: noJrnrpaHH 11 KHHlKHOH Toproann
3)Полиграфкомбинат: iloJrnrpa$KoM6HHar

Информация о PDF` ( при открытий свойства файла )
Producer: Adobe Acrobat Pro 11.0.6 Paper Capture Plug-in.
Creator: PDF Sharp 1.32.2608-w (www.pdfsharp.net)
Format: PDF-1.6

У меня больше нет идей, как получить нормальный текст из этих крякобряз...
Как решить данную проблему и нормально копировать текст ?

Вопрос задан более трёх лет назад
261 просмотр

8 комментариев

Подписаться 1 Средний 8 комментариев

Виктор @nehrung

Это ж надо, кто-то ещё до сих пор пользуется адобовским Акробатом, да ещё и Про... Давно уже есть проги, вдесятеро меньшие по объему и работающие вдвое быстрее.
Вот у меня для pdf установлен PDF-XChange Viewer, в нём есть кнопка "Т" (Текст). Кликаю по ней, активизируется текстовый слой открытого файла, и можно выделить (и скопировать, конечно) любой фрагмент текста, который перед глазами.

Написано более трёх лет назад
Demigodd @Demigodd Автор вопроса

Виктор, Проблем не в том что невозможно копировать текст, а в том что
копирую текст Издательство при вставке выдает J.-fanareJibCTBo.
В чем заключается проблема я не знаю, может при сборке PDF не правильно его собрали...

Написано более трёх лет назад
Виктор @nehrung

DEATH2298, ну хорошо, переформулирую:
Вот у меня для pdf установлен PDF-XChange Viewer, и в нём копипаста всегда происходит правильно, без искажений текста.
Так лучше? Если намёк всё ещё не понят, говорю открытым текстом - вы пробовали другой софт для PDF? Или Акробат для вас безальтернативен?

Написано более трёх лет назад
Demigodd @Demigodd Автор вопроса

Виктор, Поверь мне все перепробовал, ничего не помогло.
Эти непонятные символы не похожи на стандартные кодировки.
Вот думаю файл зашишен или что то еще.. но врятли.

Написано более трёх лет назад
Виктор @nehrung

DEATH2298, Ну, ежели дело так серьёзно... Можно выставить сюда кусочек этого файла (если удастся откусить от него кусочек), тогда мы все совместно попробуем выловить этот баг.
Но вообще-то похожая задачка решалась на заре интернета, когда резко повысилось число пользователей электропочты. И у многих из них обнаружилась проблема - проходя через цепочку почтовых серверов, письмо зачастую перекодировалось до полной неузнаваемости. Соответственно, получили популярность программы-декодеры. Лучшие из них умели расшифровывать тройную-четверную перекодировку. Сейчас всё это выродилось до онлайн-сервисов (вот например), даже есть давний очень популярный (16 подписчиков, это не хухры-мухры!) вопрос на Тостере.
Если и это не поможет, останется только распознавание исходника на кириллице через ФайнРидер, как предложено в ответе ниже.

Написано более трёх лет назад
Николай Журавлев @nicr

DEATH2298, если файл защищен - то есть программа Guapdf, я ей пользуюсь, еще ни разу не было, чтобы она не сняла защиту.

Написано более трёх лет назад
Demigodd @Demigodd Автор вопроса

Николай Журавлев,
Нет вроде не защищен. И еще шрифт какой то письменный.
Пример
Издательство -> J.-fanareJibCTBo

Написано более трёх лет назад
Николай Журавлев @nicr

DEATH2298, Ну так выложите его сюда, или ссылку на него. Я бы с интересом его поковырял своими инструментами.

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Решения вопроса 1

2 комментария

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

C++

+1 ещё

Простой
В Терминал С++ выводятся неизвестные символы?
- 1 подписчик
- 05 июн.
- 188 просмотров
3

ответа
Кодировка символов

Простой
Почему нет кодировки ISO/IEC 8859-16 на компьютере?
- 1 подписчик
- 22 мая
- 85 просмотров
1

ответ
Браузеры

+1 ещё

Простой
Как вернуть кодировку страниц?
- 1 подписчик
- 09 апр.
- 221 просмотр
2

ответа
Adobe Acrobat

Простой
Как добавить язык в Adobe Acrobat?
- 1 подписчик
- 19 дек. 2025
- 221 просмотр
3

ответа
PHP

+2 ещё

Простой
Как сконвертировать файл в формате excel в pdf?
- 4 подписчика
- 14 нояб. 2025
- 585 просмотров
4

ответа
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт. 2025
- 255 просмотров
0

ответов
Windows

+1 ещё

Простой
Как вернуть встроенный предпросмотр PDF в Windows?
- 2 подписчика
- 25 окт. 2025
- 5799 просмотров
3

ответа
PDF

+1 ещё

Простой
Как в PDF поставить штамп или сделать визуализацию ЭП при трехстороннем и более подписании?
- 2 подписчика
- 25 сент. 2025
- 3222 просмотра
5

ответов
Windows

+4 ещё

Простой
Существует ли виртуальный PDF принтер со встроенным эффектом сканера?
- 4 подписчика
- 24 сент. 2025
- 5796 просмотров
2

ответа
PDF

Простой
Есть ли альтернатива wkhtmltopdf?
- 1 подписчик
- 28 июл. 2025
- 221 просмотр
2

ответа
Показать ещё Загружается…

Это ж надо, кто-то ещё до сих пор пользуется адобовским Акробатом, да ещё и Про... Давно уже есть проги, вдесятеро меньшие по объему и работающие вдвое быстрее.
Вот у меня для pdf установлен PDF-XChange Viewer, в нём есть кнопка "Т" (Текст). Кликаю по ней, активизируется текстовый слой открытого файла, и можно выделить (и скопировать, конечно) любой фрагмент текста, который перед глазами.
Виктор, Проблем не в том что невозможно копировать текст, а в том что
копирую текст Издательство при вставке выдает J.-fanareJibCTBo.
В чем заключается проблема я не знаю, может при сборке PDF не правильно его собрали...
DEATH2298, ну хорошо, переформулирую:
Вот у меня для pdf установлен PDF-XChange Viewer, и в нём копипаста всегда происходит правильно, без искажений текста.
Так лучше? Если намёк всё ещё не понят, говорю открытым текстом - вы пробовали другой софт для PDF? Или Акробат для вас безальтернативен?
Виктор, Поверь мне все перепробовал, ничего не помогло.
Эти непонятные символы не похожи на стандартные кодировки.
Вот думаю файл зашишен или что то еще.. но врятли.
DEATH2298, Ну, ежели дело так серьёзно... Можно выставить сюда кусочек этого файла (если удастся откусить от него кусочек), тогда мы все совместно попробуем выловить этот баг.
Но вообще-то похожая задачка решалась на заре интернета, когда резко повысилось число пользователей электропочты. И у многих из них обнаружилась проблема - проходя через цепочку почтовых серверов, письмо зачастую перекодировалось до полной неузнаваемости. Соответственно, получили популярность программы-декодеры. Лучшие из них умели расшифровывать тройную-четверную перекодировку. Сейчас всё это выродилось до онлайн-сервисов (вот например), даже есть давний очень популярный (16 подписчиков, это не хухры-мухры!) вопрос на Тостере.
Если и это не поможет, останется только распознавание исходника на кириллице через ФайнРидер, как предложено в ответе ниже.
DEATH2298, если файл защищен - то есть программа Guapdf, я ей пользуюсь, еще ни разу не было, чтобы она не сняла защиту.
Николай Журавлев,
Нет вроде не защищен. И еще шрифт какой то письменный.
Пример
Издательство -> J.-fanareJibCTBo
DEATH2298, Ну так выложите его сюда, или ссылку на него. Я бы с интересом его поковырял своими инструментами.