Ответы, понравившиеся пользователю Perpetuum_Immobile — Хабр Q&A

Задать вопрос

Лайки

Алгоритмы осветления документов, бинаризация изображения и с чего начинать их изучение?

Andrey Dugin @adugin

Фактически у вас задача отделения текста от фона. Как вариант, можно воспользоваться простейшей свёрточной нейросетью-автоэнкодером: при достаточно малой длине Z-вектора (бутылочное горлышко) она научится восстанавливать фон, но не буквы. Вычитаете из исходного изображения восстановленный автоэнкодером фон, и вуаля - у вас только текст. Также можете погуглить, какой алгоритм используется в формате DJVU.

Ответ написан более трёх лет назад

Комментировать

Комментировать

Самые активные сегодня

Мизам
- 1 ответ
- 1 вопрос
Алексей Уколов
- 2 ответа
- 0 вопросов
Daemon23RUS
- 1 ответ
- 0 вопросов
goctio
- 1 ответ
- 0 вопросов
luckyjenro0
- 0 ответов
- 1 вопрос
Osco
- 0 ответов
- 1 вопрос