Определение позиций и размеров блоков текста в tessract в консольном режиме

Question

KvanTTT @KvanTTT

Определение позиций и размеров блоков текста в tessract в консольном режиме

Для распознавания текстов я использую tesseract в консольном режиме.
Входными аргументами являются
imagename — путь к изображению;
outputbase — имя файла с распознанными текстом.

Также в качестве задавать разные параметры распознавания с помощью -psm pagesegmode:
pagesegmode values are:
0 = Orientation and script detection (OSD) only.
1 = Automatic page segmentation with OSD.
2 = Automatic page segmentation, but no OSD, or OCR
3 = Fully automatic page segmentation, but no OSD. (Default)
4 = Assume a single column of text of variable sizes.
5 = Assume a single uniform block of vertically aligned text.
6 = Assume a single uniform block of text.
7 = Treat the image as a single text line.
8 = Treat the image as a single word.
9 = Treat the image as a single word in a circle.
10 = Treat the image as a single character.
-l lang and/or -psm pagesegmode must occur before anyconfigfile.

Но я так и не смог нагуглить, можно ли определять точные позиции и размеры блоков с текстом, картинками. И если можно, то как это сделать?
Эти настройки нужно задавать в конфигурационном файле configfile?

P.S. Пишу я свою программу в Visual Studio C# и она использует Tesseract.

Вопрос задан более трёх лет назад
3796 просмотров

Комментировать

Подписаться 3 Оценить Комментировать

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Искусственный интеллект

+1 ещё

Простой
Какая нейросеть лучше подойдёт для распознавания слов из mp3?
- 3 подписчика
- 21 час назад
- 421 просмотр
1

ответ
Распознавание текста

Средний
Существует бесплатная OCR-программа с поддержкой якутского языка?
- 2 подписчика
- 02 апр.
- 195 просмотров
1

ответ
Linux

+3 ещё

Простой
Чем распознать текст на картинках в PDF?
- 1 подписчик
- 30 мар.
- 252 просмотра
1

ответ
PDF

+1 ещё

Средний
Как выполнить конвертацию пдф изображений в текст?
- 1 подписчик
- 25 февр.
- 111 просмотров
1

ответ
Распознавание образов

Простой
Какой сервис использовать для распознавания лиц и дубликатов документов по фото?
- 2 подписчика
- 06 февр.
- 71 просмотр
0

ответов
Python

+1 ещё

Средний
Как отфильтровать текст Python?
- 1 подписчик
- 08 янв.
- 110 просмотров
2

ответа
Python

+3 ещё

Простой
Почему tesserat не распознает цифры? Зачеркнутый текст?
- 1 подписчик
- 08 янв.
- 96 просмотров
0

ответов
Python

+1 ещё

Средний
Как можно в Tesseract улучшить распознавание желтого шрифта на красном фоне?
- 1 подписчик
- 06 янв.
- 63 просмотра
2

ответа
Python

+2 ещё

Средний
Как повысить точность поиска фотографий одинаковых объектов/локаций, снятых с разных ракурсов?
- 7 подписчиков
- 26 дек. 2023
- 1282 просмотра
1

ответ
Распознавание текста

Простой
Как автоматически распознавать текст по url картинки?
- 1 подписчик
- 23 нояб. 2023
- 38 просмотров
1

ответ
Показать ещё Загружается…

Kotlin developer Middle/Middle+ удаленно

presto.heads

До 150 000 ₽

Golang Разработчик

Концепт Технологии

от 150 000 до 250 000 ₽

Старший системный администратор

Корпорация Экополис • Москва

от 180 000 до 200 000 ₽

Сверстать 2 транзакционных письма по макету figma

26 апр. 2024, в 16:36

3000 руб./за проект

Нужен специалист по SQL базам

26 апр. 2024, в 16:34

2000 руб./в час

Дорисовать в Figma каталог товаров

26 апр. 2024, в 16:26

3000 руб./за проект

Answer 1 · 2012-02-01 17:03:13

Сам же себе и отвечу: в tesseract 3.0 есть опция «hocr», которая позволяет возвращать не просто распознанный текст, а страницу в html формате, содержащую распознанные слова и их координаты.

Определение позиций и размеров блоков текста в tessract в консольном режиме

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт