Распознование текста в pdf с внедрением его в тот же pdf, возможно ли бесплатно, т.е. даром?

Question

ks0 @ks0

Распознование текста в pdf с внедрением его в тот же pdf, возможно ли бесплатно, т.е. даром?

Есть энное количество jpg файлов, стоит задача сперва пакетно перегнать из в pdf. Думаю с этим проблем не будет.
А потом не прилагая особых усилий распознать текст в pdf и внедрить его в файлы.
Затем файлы будут залиты в электронный архив LogicalDoc бесплатной редакции, который текстовые документы парсит и умеет по ним искать, но сам распознавать текст из рисунка, увы, не умеет.

Вопрос задан более трёх лет назад
219 просмотров

1 комментарий

Подписаться 3 Средний 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

1 комментарий

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Сделай сам

+1 ещё

Средний
Кто имеет опыт в создании калькулятора с камерой и нейросетью?
- 1 подписчик
- 03 мар.
- 418 просмотров
2

ответа
Искусственный интеллект

+1 ещё

Средний
Что лучше зоопарк или VLM для извлечения данных из ЖД накладных (грязные сканы, печати, рукопись)?
- 4 подписчика
- 05 февр.
- 512 просмотров
2

ответа
PHP

+2 ещё

Простой
Как сконвертировать файл в формате excel в pdf?
- 4 подписчика
- 14 нояб. 2025
- 579 просмотров
4

ответа
Python

+1 ещё

Простой
Как исправить проблему с Docling?
- 1 подписчик
- 28 окт. 2025
- 251 просмотр
0

ответов
Windows

+1 ещё

Простой
Как вернуть встроенный предпросмотр PDF в Windows?
- 2 подписчика
- 25 окт. 2025
- 5674 просмотра
3

ответа
PDF

+1 ещё

Простой
Как в PDF поставить штамп или сделать визуализацию ЭП при трехстороннем и более подписании?
- 2 подписчика
- 25 сент. 2025
- 3186 просмотров
5

ответов
Windows

+4 ещё

Простой
Существует ли виртуальный PDF принтер со встроенным эффектом сканера?
- 4 подписчика
- 24 сент. 2025
- 5793 просмотра
2

ответа
Распознавание текста

Простой
Какое есть ПО для обработки (распознавания) информации?
- 3 подписчика
- 19 сент. 2025
- 393 просмотра
1

ответ
PDF

Простой
Есть ли альтернатива wkhtmltopdf?
- 1 подписчик
- 28 июл. 2025
- 218 просмотров
2

ответа
Docker

+1 ещё

Простой
Как установить wkhtmltopdf на ларавель?
- 1 подписчик
- 28 июл. 2025
- 186 просмотров
1

ответ
Показать ещё Загружается…

OCR - трудоёмкая в разработке технология, бесплатно и с нормальным распознаванием русского языка - не найдёте.

Answer 1 · 2019-05-30 20:41:41

Почему текст нужно править и распознавать именно в pdf а не ранее, в jpeg?

tesseract - открытый и бесплатный набор утилит для распознавания текстов, обычно предварительно с изображением делают манипуляции используя фильтры или какую еще логику, чтобы tesseract мог это распознать (например если изображение - это не сканы а фото бумажных документов, необходимо убрать световые переходы и искажения геометрии).

p.s. 'не прилагая особых усилий' - не получится

Распознование текста в pdf с внедрением его в тот же pdf, возможно ли бесплатно, т.е. даром?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт