@AlexBoss

Как обучить tesseract под свой шрифт?

День добрый. Пытаюсь обучить tesseract v5 под свой шрифт, т.к. стандартные даже после обработок изображения показывают некорректный результат. Кто-нибудь может подсказать как это делается или кинуть мануал, уже несколько дней ищу везде безрезультатно.
  • Вопрос задан
  • 2238 просмотров
Пригласить эксперта
Ответы на вопрос 2
delvin-fil
@delvin-fil
Crazy Linux-admin
tesseract 4.1.1, pytesseract 0.3.0 жрет все(ну почти)
Код:
def ocr(self):
        global dtout
        pytesseract.pytesseract.tesseract_cmd = '/usr/bin/tesseract'
        dtout = pytesseract.image_to_string(Image.open(fname), 'rus+eng+chi_tra+jpn')
        self.ui.textOut.setText(dtout)

5e8c4a0b4c38a428035683.png
5e8c4a954fd38632050017.png

Покажите картинку, которую собираетесь распознать.
Ответ написан
Под особые задачи может подойти фреймворк Gamera. Можно распознавать даже скрипты иероглифов и разные исторические надписи. Но это больше для исследователей.
Обучение происходит интерактивно.
tutorial_selection2.png
https://gamera.informatik.hsnr.de/docs/gamera-docs...
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы