Задать вопрос
@pimanov3

Какие конфиги задать Tesseract для распознания текста?

Перебрал множество параметров, но получить полностью весь текст с изображения у меня так и не получилось.
pytesseract.image_to_string('time.jpg', lang='rus', config='--oem 3 --psm 13')

607a80388eda5804702700.jpeg
  • Вопрос задан
  • 631 просмотр
Подписаться 1 Средний 1 комментарий
Помогут разобраться в теме Все курсы
  • Яндекс Практикум
    Python-разработчик
    10 месяцев
    Далее
  • Skillfactory
    Профессия Python-разработчик
    9 месяцев
    Далее
  • Хекслет
    Python-разработчик
    10 месяцев
    Далее
Решения вопроса 1
2ord
@2ord
Насчет конфигурации не подскажу, но если разделить область на 2 строки и применить фильтры к нижней из них, то можно легко получить желаемый результат.
Сначала пороговая обработка, затем инвертировать:
607ab1095df55703689081.png
А если нужна только нижняя строка, то даже разделять на области не нужно.

На веб-ресурсе https://tesseract.projectnaptha.com/ успешно определяется как "5 м."
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы