Ответы пользователя Vindicar по тегу «Tesseract»

Задать вопрос

Ответы пользователя по тегу Tesseract

Распознавание капчи на python, как улучшить результат?

Vindicar @Vindicar
RTFM!

Ну так ты хреначишь BGR2GRAY+пороговое преобразование с фиксированным порогом, и думаешь что оно само сработает? Волшебную кнопку ждёшь?
Попробуй перегнать в HSV и поэкспериментируй с каналами, посмотри, какой наиболее информативный. Используй алгоритм Otsu для определения порога.
Попробуй разбить текст на символы, например, через connected components with stats. Если символы не касаются друг друга, должно сработать. Если касаются, то будет сложнее - нужно будет как-то разделять их ДО порогового преобразования.
Потом уже пробуй распознать каждый символ. Если шрифт всегда один и тот же, то может и pytesseract не понадобится, просто собери образцы символов и ищи их через generalized Hough-Guil.

Ответ написан более года назад

Комментировать

Комментировать

Как отфильтровать текст Python?

Vindicar @Vindicar

RTFM!

import re

pattern = re.compile(r'^\d+\.\s+')  # начало строки, 1+ цифра, точка, 1+ пробел
# re.compile() можно сделать один раз, а потом переиспользовать полученный pattern
text = '1. Салат 1'
result = pattern.sub('', text)  # заменяем пустой строкой подходящие под шаблон части text
print(result)

Ответ написан более года назад

2 комментария

Как можно в Tesseract улучшить распознавание желтого шрифта на красном фоне?

Vindicar @Vindicar
RTFM!

Перевести желтое-на-красном в чёрное-на-белом. Если цвета всегда одинаковые, то можно просто найти разность между цветом каждого пикселя и эталоном, и по ней судить о яркости: похоже = чёрное, непохоже = белое, или наоборот.

Ответ написан более года назад

Комментировать

Комментировать
Как повысить четкость распознавания текста tesseract?

Vindicar @Vindicar
RTFM!

Предварительно обрабатывай изображение.
Выдели то место, где может находиться искомый текст, сделай нормализацию гистограммы (увеличь контраст). Должно помочь.
Также можно попробовать адаптивное пороговое преобразование.

Ответ написан более двух лет назад

Комментировать

Комментировать
Каким способом удалить шум на картинке?

Vindicar @Vindicar
RTFM!

Максимум что тут можно сделать - пройтись алгоритмом connected component и отсеять все компоненты, у которых слишком маленькая площадь. Но и это повредит текст, например, удалит точки на i.

Ответ написан более трёх лет назад

Комментировать

Комментировать

Самые активные сегодня

Вячеслав Васильев
- 6 ответов
- 0 вопросов
Сережа Молодец
- 4 ответа
- 1 вопрос
sheldoncu
- 0 ответов
- 1 вопрос
Vitalya Ivanov
- 0 ответов
- 1 вопрос
As56
- 1 ответ
- 0 вопросов
smple
- 1 ответ
- 0 вопросов

Распознавание капчи на python, как улучшить результат?

Как отфильтровать текст Python?

Как можно в Tesseract улучшить распознавание желтого шрифта на красном фоне?

Как повысить четкость распознавания текста tesseract?

Каким способом удалить шум на картинке?

Войдите на сайт