Информация о PDF` ( при открытий свойства файла )
Producer: Adobe Acrobat Pro 11.0.6 Paper Capture Plug-in.
Creator: PDF Sharp 1.32.2608-w (www.pdfsharp.net)
Format: PDF-1.6
У меня больше нет идей, как получить нормальный текст из этих крякобряз...
Как решить данную проблему и нормально копировать текст ?
Это ж надо, кто-то ещё до сих пор пользуется адобовским Акробатом, да ещё и Про... Давно уже есть проги, вдесятеро меньшие по объему и работающие вдвое быстрее.
Вот у меня для pdf установлен PDF-XChange Viewer, в нём есть кнопка "Т" (Текст). Кликаю по ней, активизируется текстовый слой открытого файла, и можно выделить (и скопировать, конечно) любой фрагмент текста, который перед глазами.
Виктор, Проблем не в том что невозможно копировать текст, а в том что
копирую текст Издательство при вставке выдает J.-fanareJibCTBo.
В чем заключается проблема я не знаю, может при сборке PDF не правильно его собрали...
DEATH2298, ну хорошо, переформулирую: Вот у меня для pdf установлен PDF-XChange Viewer, и в нём копипаста всегда происходит правильно, без искажений текста.
Так лучше? Если намёк всё ещё не понят, говорю открытым текстом - вы пробовали другой софт для PDF? Или Акробат для вас безальтернативен?
Виктор, Поверь мне все перепробовал, ничего не помогло.
Эти непонятные символы не похожи на стандартные кодировки.
Вот думаю файл зашишен или что то еще.. но врятли.
DEATH2298, Ну, ежели дело так серьёзно... Можно выставить сюда кусочек этого файла (если удастся откусить от него кусочек), тогда мы все совместно попробуем выловить этот баг.
Но вообще-то похожая задачка решалась на заре интернета, когда резко повысилось число пользователей электропочты. И у многих из них обнаружилась проблема - проходя через цепочку почтовых серверов, письмо зачастую перекодировалось до полной неузнаваемости. Соответственно, получили популярность программы-декодеры. Лучшие из них умели расшифровывать тройную-четверную перекодировку. Сейчас всё это выродилось до онлайн-сервисов (вот например), даже есть давний очень популярный (16 подписчиков, это не хухры-мухры!) вопрос на Тостере.
Если и это не поможет, останется только распознавание исходника на кириллице через ФайнРидер, как предложено в ответе ниже.
DEATH2298, В Про версии Адоба открываете файл, жмете меню Файл-Сохранить как другой-Изображение. Полученную картинку открываете в Abbyу FineReader. В особо упоротом случае, если защита файла не позволяет это сделать, у ФаинРидера есть модуль делающий скриншот экрана для распознания... Этого можно добиться и другими методами
В ФаинРидере, как и в Адобе, проверте настройки языка распознования. Может Вы кирилицу через латиницу распознаете.