Имеется набор разнообразных картинок на которых есть текст. Картинки абсолютно разные с разными фонами и т.д.
На выходе хочу получить распознанный текст из картинки.
Поиграв с tesseract - он относительно неплохо распознает картинки которые на белом фоне, но отвратительно распознает неструктурированный текст на фоне какой-нибудь картинки.
Если правильно понимаю, то для начала необходимо с помощью нейронки найти все буквы на картинке - перенести их на новый чистый холст (белый фон).
А потом собственно попытаться распознать силами tesseract.
Скажите, кто-нибудь уже пытался решить подобную задачу (извлечение букв из картинки)?