@pimanov3

Какие конфиги задать Tesseract для распознания текста?

Перебрал множество параметров, но получить полностью весь текст с изображения у меня так и не получилось.
pytesseract.image_to_string('time.jpg', lang='rus', config='--oem 3 --psm 13')

607a80388eda5804702700.jpeg
  • Вопрос задан
  • 442 просмотра
Решения вопроса 1
Насчет конфигурации не подскажу, но если разделить область на 2 строки и применить фильтры к нижней из них, то можно легко получить желаемый результат.
Сначала пороговая обработка, затем инвертировать:
607ab1095df55703689081.png
А если нужна только нижняя строка, то даже разделять на области не нужно.

На веб-ресурсе https://tesseract.projectnaptha.com/ успешно определяется как "5 м."
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы