Как обработать изображение к EasyOCR и удалить на нем шумы, python?

Question

glu-dimaz @glu-dimaz

Tesseract

Как обработать изображение к EasyOCR и удалить на нем шумы, python?

Стала задача Парсинга японских сертификатов на экспорт автомобилей, а именно - необходимо вытаскивать с документов в формате .pdf - вин номер авто и его габариты. Сначала пытался реализовать данную задачу с помощью Tesseract, но в конечном итоге - отказался от него в пользу EasyOCR.

В общем, так как документ большой 2700 х 1900 , и нам не важно его содержимое, по мимо 5 ячеек в таблице - я подобрал +- координаты областей, в которых расположен необходимый текст. Путем ловких манипуляций, обрезки, финальной подгонки и регулировки яркости и контрастности - получилось.

Но, после пошли в ход - черно-белые сканы, с большим количеством шумов. После обрезки по необходимым областям, картинка была следующая:

Как победить эти шумы? Есть ли аналоги EasyOCR, которые будут читать текст не смотря на этот шум.

Вопрос задан более года назад
159 просмотров

4 комментария

Подписаться 1 Средний 4 комментария

Алексей Черемисин @leahch

Рекомендую книжку "Цифровая обработка изображений. Вудс Гонсалес".
Простой пороговый фильтр должен помочь.
Берем точку и квадратик вокруг нее и считаем плотность, если плотность не превышает некий порог, точку зануляем.

Написано более года назад
U235U235 @U235U235

Алексей Черемисин, книжка хороша, но то что вы описали это не пороговый фильтр, а скорее медианный.
Как вариант, можно бинаризировать, сделать анализ связных компонент и отфильтровать все, что меньше заданого значения по площади.
p.s. я бы еще предварительно апскейл сделал в 2 раза, т.к. разрешение низкое.

Написано более года назад
Алексей Черемисин @leahch

U235U235, да, Вы правы. Уж давно всем этим не занимался.
Бинаризация как раз в тему была бы.
1) построить гистограмму
2) найти 95 перцентиль
3) отбросить все что меньше и не влезло и тут же бинаризировать по этому значению
4) ну а здесь уже можно и фильтрануть

В принципе все это должно бьыть в PIL

Написано более года назад
Steel_Balls @Steel_Balls

U235U235, медианный фильтр, как и JPEG плохо работает на полутоновом изображении с резкими границами (текст, графики, чертежи...)

Написано более года назад

Помогут разобраться в теме Все курсы

Яндекс Практикум

Python-разработчик

10 месяцев

Далее
Skillfactory

DevOps-инженер

6 месяцев

Далее
Хекслет

Фронтенд-разработчик

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

2 комментария

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как исправить ошибку при выполнении кода с Tesseract-OCR (не видит русский язык)?
- 1 подписчик
- 03 февр.
- 364 просмотра
1

ответ
Python

+2 ещё

Простой
Распознавание капчи на python, как улучшить результат?
- 2 подписчика
- более года назад
- 194 просмотра
2

ответа
Нейронные сети

+2 ещё

Простой
Какие есть нейросети для распознавания русского/английского?
- 5 подписчиков
- более года назад
- 1893 просмотра
1

ответ
Python

+1 ещё

Средний
Как отфильтровать текст Python?
- 1 подписчик
- более года назад
- 137 просмотров
2

ответа
Python

+3 ещё

Простой
Почему tesserat не распознает цифры? Зачеркнутый текст?
- 1 подписчик
- более года назад
- 186 просмотров
0

ответов
Python

+1 ещё

Средний
Как можно в Tesseract улучшить распознавание желтого шрифта на красном фоне?
- 1 подписчик
- более года назад
- 76 просмотров
2

ответа
CAPTCHA

+1 ещё

Простой
Pytesseract не распознает текст?
- 1 подписчик
- более двух лет назад
- 81 просмотр
0

ответов
Python

+1 ещё

Простой
Как повысить четкость распознавания текста tesseract?
- 1 подписчик
- более двух лет назад
- 135 просмотров
1

ответ
Python

+1 ещё

Простой
Как вводить букву от рук пользователя?
- 2 подписчика
- более трёх лет назад
- 200 просмотров
2

ответа
Показать ещё Загружается…

Технический руководитель/Technical Lead(государственная информационная система)

ЛАНИТ • Москва

До 400 000 ₽

Linux администратор HPC стека

Сбер • Москва

от 200 000 до 350 000 ₽

Senior DevOps Engineer / Инженер по инфраструктуре / SRE

Hunt Rangers • Москва

от 440 000 ₽

Рекомендую книжку "Цифровая обработка изображений. Вудс Гонсалес".
Простой пороговый фильтр должен помочь.
Берем точку и квадратик вокруг нее и считаем плотность, если плотность не превышает некий порог, точку зануляем.
Алексей Черемисин, книжка хороша, но то что вы описали это не пороговый фильтр, а скорее медианный.
Как вариант, можно бинаризировать, сделать анализ связных компонент и отфильтровать все, что меньше заданого значения по площади.
p.s. я бы еще предварительно апскейл сделал в 2 раза, т.к. разрешение низкое.
U235U235, да, Вы правы. Уж давно всем этим не занимался.
Бинаризация как раз в тему была бы.
1) построить гистограмму
2) найти 95 перцентиль
3) отбросить все что меньше и не влезло и тут же бинаризировать по этому значению
4) ну а здесь уже можно и фильтрануть

В принципе все это должно бьыть в PIL
U235U235, медианный фильтр, как и JPEG плохо работает на полутоновом изображении с резкими границами (текст, графики, чертежи...)

Answer 1 · 2024-10-04 06:13:26

Устранение шумов можно попробовать вариацией применения нескольких фильтров: Превитта, Собеля, Лапласа, Гаусса, эрозией/диляцией. Так же можно попробовать FFT (Быстрое Фурье Преобразование).
Довольно мощный опенсорсный OCR - TesseractOCR https://github.com/tesseract-ocr/tesseract

Как обработать изображение к EasyOCR и удалить на нем шумы, python?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт