@lStarLexl

Как до обучить Pytesseract под свой шрифт?

Я хотел бы до обучить pytesseract. Мне нужно что-бы он видел буквы и их вводил на клаве. В итоге 36-50% Он распознаёт не правильно. То вместо “I” выдаёт «1». Или вместо “J” говорит что это «7» или какой-то греческий символ. «S” большую и «s” маленькую часто путает. Делаю скрин с экрана поэтому изображение нормального качества. Просто шрифт немного угловатый. Вот как-бы мне немного доучить pytesseract под свой шрифт. Весь инет облазил и особо инфы нет на этот счёт. Например: 631c81466c213166286553.png https://wdho.ru/856776 Вот эту фотку он считывает как: fffj434 ffjfji jf
  • Вопрос задан
  • 189 просмотров
Пригласить эксперта
Ответы на вопрос 1
mayton2019
@mayton2019
Bigdata Engineer
Системы, распознающие текст содержат обычно несколько уровней распознавания. Один - это собственно нейросеть которая видит с разной вероятностью символы-кандидаты. Второй уровень - это семантика слов и предложений. Тоесть когда ты распознаешь осмысленный текст - то ты обладаешь бОльшей информацией о том как достроить неверно распознанные символы.

В случае с билибердой написанной как

fffjjj ....

второй уровень даёт сбой. Он не видит знакомых слов.

На самом деле я не знаю как работает тессеракт. Надо читать его настройки. Но если-бы я распознавал билиберду из символов - то я-бы искал именно эти языковые семантические настройки.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы