Как обработать изображение к EasyOCR и удалить на нем шумы, python?

Question

glu-dimaz @glu-dimaz

Tesseract

Как обработать изображение к EasyOCR и удалить на нем шумы, python?

Стала задача Парсинга японских сертификатов на экспорт автомобилей, а именно - необходимо вытаскивать с документов в формате .pdf - вин номер авто и его габариты. Сначала пытался реализовать данную задачу с помощью Tesseract, но в конечном итоге - отказался от него в пользу EasyOCR.

В общем, так как документ большой 2700 х 1900 , и нам не важно его содержимое, по мимо 5 ячеек в таблице - я подобрал +- координаты областей, в которых расположен необходимый текст. Путем ловких манипуляций, обрезки, финальной подгонки и регулировки яркости и контрастности - получилось.

Но, после пошли в ход - черно-белые сканы, с большим количеством шумов. После обрезки по необходимым областям, картинка была следующая:

Как победить эти шумы? Есть ли аналоги EasyOCR, которые будут читать текст не смотря на этот шум.

Вопрос задан более года назад
216 просмотров

4 комментария

Подписаться 1 Средний 4 комментария

Алексей Черемисин @leahch

Рекомендую книжку "Цифровая обработка изображений. Вудс Гонсалес".
Простой пороговый фильтр должен помочь.
Берем точку и квадратик вокруг нее и считаем плотность, если плотность не превышает некий порог, точку зануляем.

Написано более года назад
U235U235 @U235U235

Алексей Черемисин, книжка хороша, но то что вы описали это не пороговый фильтр, а скорее медианный.
Как вариант, можно бинаризировать, сделать анализ связных компонент и отфильтровать все, что меньше заданого значения по площади.
p.s. я бы еще предварительно апскейл сделал в 2 раза, т.к. разрешение низкое.

Написано более года назад
Алексей Черемисин @leahch

U235U235, да, Вы правы. Уж давно всем этим не занимался.
Бинаризация как раз в тему была бы.
1) построить гистограмму
2) найти 95 перцентиль
3) отбросить все что меньше и не влезло и тут же бинаризировать по этому значению
4) ну а здесь уже можно и фильтрануть

В принципе все это должно бьыть в PIL

Написано более года назад
Steel_Balls @Steel_Balls

U235U235, медианный фильтр, как и JPEG плохо работает на полутоновом изображении с резкими границами (текст, графики, чертежи...)

Написано более года назад

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как исправить ошибку при выполнении кода с Tesseract-OCR (не видит русский язык)?
- 1 подписчик
- более года назад
- 534 просмотра
1

ответ
Python

+2 ещё

Простой
Распознавание капчи на python, как улучшить результат?
- 2 подписчика
- более двух лет назад
- 203 просмотра
2

ответа
Нейронные сети

+2 ещё

Простой
Какие есть нейросети для распознавания русского/английского?
- 5 подписчиков
- более двух лет назад
- 1970 просмотров
1

ответ
Python

+1 ещё

Средний
Как отфильтровать текст Python?
- 1 подписчик
- более двух лет назад
- 143 просмотра
2

ответа
Python

+3 ещё

Простой
Почему tesserat не распознает цифры? Зачеркнутый текст?
- 1 подписчик
- более двух лет назад
- 208 просмотров
0

ответов
Python

+1 ещё

Средний
Как можно в Tesseract улучшить распознавание желтого шрифта на красном фоне?
- 1 подписчик
- более двух лет назад
- 88 просмотров
2

ответа
CAPTCHA

+1 ещё

Простой
Pytesseract не распознает текст?
- 1 подписчик
- более трёх лет назад
- 86 просмотров
0

ответов
Python

+1 ещё

Простой
Как повысить четкость распознавания текста tesseract?
- 1 подписчик
- более трёх лет назад
- 151 просмотр
1

ответ
Python

+1 ещё

Простой
Как вводить букву от рук пользователя?
- 2 подписчика
- более трёх лет назад
- 210 просмотров
2

ответа
Показать ещё Загружается…

Рекомендую книжку "Цифровая обработка изображений. Вудс Гонсалес".
Простой пороговый фильтр должен помочь.
Берем точку и квадратик вокруг нее и считаем плотность, если плотность не превышает некий порог, точку зануляем.
Алексей Черемисин, книжка хороша, но то что вы описали это не пороговый фильтр, а скорее медианный.
Как вариант, можно бинаризировать, сделать анализ связных компонент и отфильтровать все, что меньше заданого значения по площади.
p.s. я бы еще предварительно апскейл сделал в 2 раза, т.к. разрешение низкое.
U235U235, да, Вы правы. Уж давно всем этим не занимался.
Бинаризация как раз в тему была бы.
1) построить гистограмму
2) найти 95 перцентиль
3) отбросить все что меньше и не влезло и тут же бинаризировать по этому значению
4) ну а здесь уже можно и фильтрануть

В принципе все это должно бьыть в PIL
U235U235, медианный фильтр, как и JPEG плохо работает на полутоновом изображении с резкими границами (текст, графики, чертежи...)

Answer 1 · 2024-10-04 06:13:26

Устранение шумов можно попробовать вариацией применения нескольких фильтров: Превитта, Собеля, Лапласа, Гаусса, эрозией/диляцией. Так же можно попробовать FFT (Быстрое Фурье Преобразование).
Довольно мощный опенсорсный OCR - TesseractOCR https://github.com/tesseract-ocr/tesseract

Как обработать изображение к EasyOCR и удалить на нем шумы, python?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт