@pimanov3

Какие конфиги задать Tesseract для распознания текста?

Перебрал множество параметров, но получить полностью весь текст с изображения у меня так и не получилось.
pytesseract.image_to_string('time.jpg', lang='rus', config='--oem 3 --psm 13')

607a80388eda5804702700.jpeg
  • Вопрос задан
  • 519 просмотров
Решения вопроса 1
2ord
@2ord
Насчет конфигурации не подскажу, но если разделить область на 2 строки и применить фильтры к нижней из них, то можно легко получить желаемый результат.
Сначала пороговая обработка, затем инвертировать:
607ab1095df55703689081.png
А если нужна только нижняя строка, то даже разделять на области не нужно.

На веб-ресурсе https://tesseract.projectnaptha.com/ успешно определяется как "5 м."
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы
22 нояб. 2024, в 02:56
10000 руб./за проект
22 нояб. 2024, в 00:55
500 руб./за проект
21 нояб. 2024, в 23:30
300000 руб./за проект