Алгоритмы осветления документов, бинаризация изображения и с чего начинать их изучение?

Question

Perpetuum_Immobile @Perpetuum_Immobile

Алгоритмы осветления документов, бинаризация изображения и с чего начинать их изучение?

Не так давно мне с моим товарищем поручили программно-исследовательский проект о способах осветления документов.

Было выделено два основных пути — классические алгоритмы и нейросети, а также подобрана программа, на которой можно экспериментировать во благо исследования — Tesseract-OCR. Собственно, возник вопрос: а с чего начать? Где найти примеры алгоритмов и нейросетей (а также где можно ознакомиться с их особенностями и реализацией)? С чего вообще начать изучение нейросетей и алгоритмов, распознающих изображения?

С этими вопросами я хочу обратиться сюда, а также обязуюсь пополнять этот или отдельный ресурс уже найденными и проверенными ответами на эти вопросы (ссылку прикреплю к вопросу тем или иным способом).

Любой материал, относящийся к теме, приветствуется.

Вопрос задан более трёх лет назад
256 просмотров

Комментировать

Подписаться 3 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

ИИ в медицине: как использовать в работе каждый день

8 недель

Далее
Академия Эдюсон

Нейросети в строительстве

2 месяца

Далее
Бруноям

ИИ-агенты и n8n

2 месяца

Далее

Пригласить эксперта

Ответы на вопрос 2

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Нейронные сети

Простой
Как решить проблему с генерацией видео в Kling AI?
- 1 подписчик
- 09 июл.
- 59 просмотров
1

ответ
Хранение данных

+3 ещё

Средний
Как организовать обучение нейронной сети?
- 1 подписчик
- 07 июл.
- 106 просмотров
2

ответа
Обработка изображений

+1 ещё

Простой
Через какой ИИ можно массово редактировать изображения?
- 2 подписчика
- 30 июн.
- 387 просмотров
3

ответа
Python

+1 ещё

Средний
Может кто помочь исправить код LTSM нейросети?
- 1 подписчик
- 12 июн.
- 283 просмотра
2

ответа
Нейронные сети

Средний
Как в AI ToolKit для тренировки LorA указать свои модели?
- 1 подписчик
- 09 июн.
- 69 просмотров
1

ответ
Обработка изображений

Простой
Можно распознать госномер по фото?
- 2 подписчика
- 29 мая
- 340 просмотров
3

ответа
Нейронные сети

Простой
Есть ли нейросети для интерактивной работы с изображениями?
- 2 подписчика
- 13 мая
- 285 просмотров
2

ответа
Боты

+1 ещё

Простой
Какие посоветуете лучшие доступные LLM, для организации на её базе офисного бота?
- 2 подписчика
- 06 мая
- 402 просмотра
5

ответов
Нейронные сети

+1 ещё

Средний
Где найти мне датасет для обучения малюсенькой LLM?
- 2 подписчика
- 07 апр.
- 245 просмотров
1

ответ
Нейронные сети

+1 ещё

Простой
Возможно ли создать ии агента для автоматической рассылки сообщений на сайте знакомств?
- 1 подписчик
- 19 мар.
- 195 просмотров
3

ответа
Показать ещё Загружается…

Answer 1 · 2020-11-17 19:21:10

Фактически у вас задача отделения текста от фона. Как вариант, можно воспользоваться простейшей свёрточной нейросетью-автоэнкодером: при достаточно малой длине Z-вектора (бутылочное горлышко) она научится восстанавливать фон, но не буквы. Вычитаете из исходного изображения восстановленный автоэнкодером фон, и вуаля - у вас только текст. Также можете погуглить, какой алгоритм используется в формате DJVU.

Answer 2 · 2020-11-18 09:03:28

Александр Скуснов @AlexSku

не буду отвечать из-за модератора

Гонсалес, Вудс "Цифровая обработка изображений"

Ответ написан более трёх лет назад

Комментировать

Алгоритмы осветления документов, бинаризация изображения и с чего начинать их изучение?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт