BadCats
@BadCats

OCR библиотеки под C#?

Пробовал IronOCR и Tesseract OCR ( обёртка под .NET). В Tesseract пробовал разные режимы фрагментации страницы - результат плохой - мусор или часть текста и мусор. На вход подаётся бинаризирование ( Ч/Б ) изображение документа. На фото не только текст - ещё мусор в виде фотографии и подписи человека, но его постараюсь устранить. Ещё одна трудность - на изображении несколько языков одновременно - русский и английский или английский и фарси ( арабский). Пока что пытаюсь разобраться с русским и английским - хотя бы.Есть ли ещё библиотеки/альтернативы - вышеуказанным?
  • Вопрос задан
  • 317 просмотров
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы