AmanitaRubescens
@AmanitaRubescens
Шалтай-болтай

Как вытащить из PDF текст?

Есть книга в PDF, качество не ахти. Распечатал пару страниц, глянуть как будет для глаз - глаза все переломаешь, пока будешь читать.
Вот на картинке, текст выше красной линии - книга в отличном качестве (другая книга), ниже то что хочу распечатать.
spoiler
64286ec504558670202860.jpeg

Если взять pdf с плохим качеством книги и уменьшать/увеличивать размер страницы, то как бы проскакивает текст в хорошем качестве, потом плохой текст его перекрывает (т.е. оригинал).
https://gifyu.com/image/SIDyk
Вот тот самый "проскакивающий качественный текст" можно как то вытащить? Он же где то существует? Или что это такое?
  • Вопрос задан
  • 284 просмотра
Пригласить эксперта
Ответы на вопрос 2
AgentSmith
@AgentSmith
Это мой правильный ответ на твой вопрос
Это сканированный текст и перевести его в текстовый вид с помощью OCR - это такой геморрой, что проще было бы найти ту же самую книгу в нормальном виде. В бумажном, например
Ответ написан
phaggi
@phaggi
лужу, паяю, ЭВМы починяю
Вы не тем занимаетесь. Если вам нужно изучать язык программирования, так изучайте. Поверьте, Лутц это не на пару дней работы.
Хотите относительного комфорта - возьмите планшет типа старого iPad с достаточной диагональю и читайте свой pdf с планшета.
Не смотря на наличие бумажного тома я сам делал именно так. Недорогой б/у планшет с хорошим дисплеем будет дешевле или сравнимо со стоимостью бумажной книги. И полезнее и универсальнее.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы