Как правильно очистить картинку с текстом от шума для использования ее в Tesseract OCR?

Question

Андрей @xaoc80

Как правильно очистить картинку с текстом от шума для использования ее в Tesseract OCR?

Суть вопроса вот в чем. Имеется бинарная картинка (гос. номер автомобиля). Картинка передается далее в tesseract API для распознавания текста. Если шумов нет, то все работает нормально — текст распознается. Однако, в реальности всегда присутствуют пятна на изображении. Размытие Гаусса и операции морфологии уже применены, мелкие детали отфильтрованы. Но остается несколько пятен, которые приводят к неверному результату при распознавании символов. Может быть есть возможность как то настроить tesseract? Я использую все настройки по умолчанию. По идее необходимо выделить связные области на автономере и отфильтровать те, которые имеют заведомо малую площадь. Но как это быстро сделать с помощью opencv, я не знаю. Спасибо.

Add

Если кому-нибудь будет интересно, то эту задачу можно решить так.
Применить оператор Кэнни к изображению автомобильного номера, при этом искать лишь внешние контуры
Затем отфильтровать полученные контуры по размеру, вырезать их и распознавать каждый символ отдельно.
Производительность при этом почти не падает.

Вопрос задан более трёх лет назад
4387 просмотров

Комментировать

Подписаться 3 Оценить Комментировать

Помогут разобраться в теме Все курсы

Skillbox

Нейросети для работы с графикой и видео

1 месяц

Далее
Onskills

Нейросеть Stable Diffusion

1 месяц

Далее
Level One

Фотография: как делать хорошие снимки

7 недель

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Системное администрирование

+2 ещё

Средний
Сервер с GPU предназначен ли для запуска фронтенда/бэкенда или он для вычислений?
- 1 подписчик
- 08 нояб. 2025
- 376 просмотров
1

ответ
Windows

+4 ещё

Простой
Существует ли виртуальный PDF принтер со встроенным эффектом сканера?
- 4 подписчика
- 24 сент. 2025
- 5761 просмотр
2

ответа
Python

+3 ещё

Простой
Есть решение сборки Python в Exe с библиотекой Opencv?
- 1 подписчик
- 09 сент. 2025
- 277 просмотров
1

ответ
Обработка изображений

+1 ещё

Средний
Возможен ли сегодня пакетный анализ изображений при помощи ИИ-моделей?
- 2 подписчика
- 02 сент. 2025
- 161 просмотр
3

ответа
Python

+2 ещё

Средний
Нужно дополнить код в Python. Как добавить значения к цветам или выделить контуры более детально с прикреплением значений?
- 2 подписчика
- более года назад
- 490 просмотров
0

ответов
Обработка изображений

Простой
Как правильно называется подгонка соотношения сторон?
- 1 подписчик
- более года назад
- 103 просмотра
3

ответа
Python

+1 ещё

Средний
Как избавится от эффекта бандинга/постеризации градиента?
- 1 подписчик
- более года назад
- 167 просмотров
2

ответа
Windows

+4 ещё

Средний
Почему эмуляция кликов мыши через SendInput блокируется после трёх срабатываний?
- 1 подписчик
- более года назад
- 399 просмотров
1

ответ
Adobe Photoshop

+1 ещё

Простой
Чем в design time апскейлить растровые изображения размером 64..128px?
- 1 подписчик
- более года назад
- 77 просмотров
0

ответов
Нейронные сети

+1 ещё

Средний
Почему MidJourney и другие ИИ изменяют мою исходную картинку?
- 1 подписчик
- более года назад
- 711 просмотров
4

ответа
Показать ещё Загружается…

Answer 1 · 2012-11-13 09:37:12

Пытаюсь заняться похожим, необходимо распознать на квитанциях номера. При распознавании есть проблемы — мешаются мелкие детали по краям. Но поскольку далек от обработки изображений, не пойму фразы «отфильтровать полученные контуры по размеру, вырезать». Это выполняется с помощью opencv? Не подскажите где можно глянуть как это делается?

Answer 2 · 2012-11-13 09:43:19

«Это выполняется с помощью opencv? Не подскажите где можно глянуть как это делается? »
Да, это можно сделать с помощью opencv
Я на IBM DW статью накатал с примерами кода если интересно — стучите ссылку дам в личку

Как правильно очистить картинку с текстом от шума для использования ее в Tesseract OCR?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт