OCR библиотеки под C#?

Question

BadCats @BadCats

OCR библиотеки под C#?

Пробовал IronOCR и Tesseract OCR ( обёртка под .NET). В Tesseract пробовал разные режимы фрагментации страницы - результат плохой - мусор или часть текста и мусор. На вход подаётся бинаризирование ( Ч/Б ) изображение документа. На фото не только текст - ещё мусор в виде фотографии и подписи человека, но его постараюсь устранить. Ещё одна трудность - на изображении несколько языков одновременно - русский и английский или английский и фарси ( арабский). Пока что пытаюсь разобраться с русским и английским - хотя бы.Есть ли ещё библиотеки/альтернативы - вышеуказанным?

Вопрос задан более трёх лет назад
301 просмотр

5 комментариев

Подписаться 2 Средний 5 комментариев

ayazer @ayazer

лет 7-8 назад работал с nuance ocr. там была возможность разделить документ на блоки, и дальше каждый блок распознавать в зависимости от его типа (тест/изображение/етц). В итоге для документов сначала мышкой накидывались области распознавания, а потом батчем все прогонялось через ocr.

Написано более трёх лет назад
freeExec @freeExec

подаётся бинаризирование ( Ч/Б ) изображение документа

Для лучшего эффекта нужно в оттенках серого, а не тупо ЧБ.

Написано более трёх лет назад
BadCats @BadCats Автор вопроса

Разве? Я думал, что бинаризрованое изображение наоборот лучше - т.к есть четкий переход между контурами - от 0 до 255 - т.е только два пороговых значения, что облегчает поиск конутра/символа?

Написано более трёх лет назад
freeExec @freeExec

BadCats, В итоге у тебя незначительный шум превращается в значительный.

Написано более трёх лет назад
BadCats @BadCats Автор вопроса

freeExec, Не совсем понял ( ну, буквально проблему понял, но не понимаю почему), я так понимаю, нужно подтянуть знания в ЦОС ( соотношение сигнал/шум ) ? Если да, то не могли бы Вы посоветовать что почитать. Т.к до этого вообще с этой областью не работал - ни с ЦОС, ни с изображениями, ни с OCR - начал читать Гонсалеса и Вудса - " цифровая обработка изображений" - делал по ней фильтры изображений ( что то руками писал, что то - ро библиотекам, но смотрел что вообще за фильтры бывают, (Собела,Гауса, частичная фильтрация и т.д) какие эффекты дают). Спасибо.

Написано более трёх лет назад

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

C#

+1 ещё

Простой
Как решить проблему database is locked?
- 1 подписчик
- вчера
- 70 просмотров
1

ответ
C#

Простой
C# и несколько CPU?
- 6 подписчиков
- 15 апр.
- 3280 просмотров
3

ответа
C#

+1 ещё

Простой
Как сделать смену обьекта при приближении?
- 1 подписчик
- 14 апр.
- 68 просмотров
1

ответ
Windows

+2 ещё

Простой
Как обеспечить относительный путь к БД SQLite?
- 1 подписчик
- 14 апр.
- 116 просмотров
3

ответа
C#

+1 ещё

Простой
Как понять что я выучил основы C#?
- 1 подписчик
- 12 апр.
- 461 просмотр
4

ответа
C#

+1 ещё

Средний
Почему не работают миграции при переходе на новый csproj формат?
- 1 подписчик
- 12 апр.
- 54 просмотра
1

ответ
C#

Простой
Что означает оператор => в linq c#?
- 1 подписчик
- 12 апр.
- 133 просмотра
2

ответа
C#

+1 ещё

Простой
Почему некорректно работает параметр маршрутизатора Razor Pages?
- 1 подписчик
- 11 апр.
- 52 просмотра
1

ответ
C#

Простой
Как сделать чтобы приложение для win ce открывалось на весь экран?
- 1 подписчик
- 11 апр.
- 51 просмотр
1

ответ
C#

+3 ещё

Простой
Как решить проблему подключения БД к WPF проекту?
- 1 подписчик
- 11 апр.
- 85 просмотров
2

ответа
Показать ещё Загружается…

Разработчик C# (криптография)

Avanpost

от 200 000 ₽

Middle+ .Net(C#) developer

RateX

от 200 000 до 300 000 ₽

Middle C# developer

ЮГПА • Ростов-на-Дону

от 130 000 до 170 000 ₽

Перекрасить 2 вкладыш для типографии в новый цвет

18 апр. 2024, в 15:55

500 руб./за проект

Починить лайки и удаление сторис на React Native

18 апр. 2024, в 15:52

2500 руб./за проект

Требуется переводчик на португальский

18 апр. 2024, в 15:39

500 руб./в час

лет 7-8 назад работал с nuance ocr. там была возможность разделить документ на блоки, и дальше каждый блок распознавать в зависимости от его типа (тест/изображение/етц). В итоге для документов сначала мышкой накидывались области распознавания, а потом батчем все прогонялось через ocr.
подаётся бинаризирование ( Ч/Б ) изображение документа

Для лучшего эффекта нужно в оттенках серого, а не тупо ЧБ.
Разве? Я думал, что бинаризрованое изображение наоборот лучше - т.к есть четкий переход между контурами - от 0 до 255 - т.е только два пороговых значения, что облегчает поиск конутра/символа?
BadCats, В итоге у тебя незначительный шум превращается в значительный.
freeExec, Не совсем понял ( ну, буквально проблему понял, но не понимаю почему), я так понимаю, нужно подтянуть знания в ЦОС ( соотношение сигнал/шум ) ? Если да, то не могли бы Вы посоветовать что почитать. Т.к до этого вообще с этой областью не работал - ни с ЦОС, ни с изображениями, ни с OCR - начал читать Гонсалеса и Вудса - " цифровая обработка изображений" - делал по ней фильтры изображений ( что то руками писал, что то - ро библиотекам, но смотрел что вообще за фильтры бывают, (Собела,Гауса, частичная фильтрация и т.д) какие эффекты дают). Спасибо.

OCR библиотеки под C#?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт