Ответы пользователя по тегу Tesseract
  • Распознавание капчи на python, как улучшить результат?

    Vindicar
    @Vindicar
    RTFM!
    Ну так ты хреначишь BGR2GRAY+пороговое преобразование с фиксированным порогом, и думаешь что оно само сработает? Волшебную кнопку ждёшь?
    Попробуй перегнать в HSV и поэкспериментируй с каналами, посмотри, какой наиболее информативный. Используй алгоритм Otsu для определения порога.
    Попробуй разбить текст на символы, например, через connected components with stats. Если символы не касаются друг друга, должно сработать. Если касаются, то будет сложнее - нужно будет как-то разделять их ДО порогового преобразования.
    Потом уже пробуй распознать каждый символ. Если шрифт всегда один и тот же, то может и pytesseract не понадобится, просто собери образцы символов и ищи их через generalized Hough-Guil.
    Ответ написан
    Комментировать
  • Как отфильтровать текст Python?

    Vindicar
    @Vindicar
    RTFM!
    Регулярные выражения в Питоне
    import re
    
    pattern = re.compile(r'^\d+\.\s+')  # начало строки, 1+ цифра, точка, 1+ пробел
    # re.compile() можно сделать один раз, а потом переиспользовать полученный pattern
    text = '1. Салат 1'
    result = pattern.sub('', text)  # заменяем пустой строкой подходящие под шаблон части text
    print(result)
    Ответ написан
    2 комментария
  • Как можно в Tesseract улучшить распознавание желтого шрифта на красном фоне?

    Vindicar
    @Vindicar
    RTFM!
    Перевести желтое-на-красном в чёрное-на-белом. Если цвета всегда одинаковые, то можно просто найти разность между цветом каждого пикселя и эталоном, и по ней судить о яркости: похоже = чёрное, непохоже = белое, или наоборот.
    Ответ написан
    Комментировать
  • Как повысить четкость распознавания текста tesseract?

    Vindicar
    @Vindicar
    RTFM!
    Предварительно обрабатывай изображение.
    Выдели то место, где может находиться искомый текст, сделай нормализацию гистограммы (увеличь контраст). Должно помочь.
    Также можно попробовать адаптивное пороговое преобразование.
    Ответ написан
    Комментировать
  • Каким способом удалить шум на картинке?

    Vindicar
    @Vindicar
    RTFM!
    Максимум что тут можно сделать - пройтись алгоритмом connected component и отсеять все компоненты, у которых слишком маленькая площадь. Но и это повредит текст, например, удалит точки на i.
    Ответ написан
    Комментировать