Распознавание сканированной копии документа на веб сайте! С чего начать?

Question

Dazz1e @Dazz1e

PHP
OpenCV

Распознавание сканированной копии документа на веб сайте! С чего начать?

Здравствуйте,

Задача в создании автоматизированного фильтра документов поступающих в онлайн архив.
Имеются известные бланки документов.
Каким образом при загрузке изображения (скан. копии документа) прочесть документ и если в обязательных полях ни чего не введено (даже какой либо закарючки), то документ не пропускается, если что то там есть - документ попадает в архив и создается текстовый файл (лог) в каких именно полях (включая обязательные и не обязательные) имеется информация?
Считывать текст не нужно, хотя бы убедиться что там что то есть.

Бланк:

Образец:

Прошу объяснить с чего начать для достижения цели и в каком направлении двигаться!
Заранее благодарю!

Вопрос задан более трёх лет назад
306 просмотров

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Skillbox

Профессия PHP-разработчик с нуля до PRO

7 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 4

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

Простой
PDO не видит внутри функции?
- 1 подписчик
- 25 апр.
- 173 просмотра
2

ответа
PHP

Средний
Как подключиться к серверу PHP и чтобы отображались исполнители?
- 1 подписчик
- 24 апр.
- 174 просмотра
2

ответа
PHP

+3 ещё

Средний
Как организовать автоматическую выдачу цифровых товаров после оплаты на чистом PHP?
- 2 подписчика
- 20 апр.
- 232 просмотра
3

ответа
PHP

Простой
Не работает яндекс ссылка прямая?
- 1 подписчик
- 07 апр.
- 201 просмотр
1

ответ
PHP

Простой
Почему слетает сайт при загрузке обработчика?
- 1 подписчик
- 02 апр.
- 223 просмотра
1

ответ
JavaScript

+2 ещё

Средний
Авторизация вконтакте как настроить?
- 2 подписчика
- 26 мар.
- 369 просмотров
1

ответ
PHP

Простой
СТРОКА — где искать ее истоки на сайте?
- 1 подписчик
- 11 мар.
- 377 просмотров
2

ответа
PHP

Простой
Есть ли такая функция сравнения?
- 2 подписчика
- 09 мар.
- 325 просмотров
1

ответ
JavaScript

+2 ещё

Простой
Как быть если ломается сайт, в зависимости от браузера?
- 1 подписчик
- 05 мар.
- 529 просмотров
1

ответ
PHP

Простой
Как отправить файл в Телеграм через OpenServer 6.5.0?
- 1 подписчик
- 02 мар.
- 249 просмотров
1

ответ
Показать ещё Загружается…

PHP-разработчик

Остров Сокровищ

от 15 000 до 250 000 ₽

Программист PHP

Базис-Центр • Коломна

от 70 000 до 250 000 ₽

PHP и Node.js разработчик

TripShock Adventures

от 1 000 до 2 500 $

Answer 1 · 2015-04-07 16:43:45

Сергей @begemot_sun

Программист в душе.

С интеграцией с сервисами ABBY

Ответ написан более трёх лет назад

1 комментарий

Answer 2 · 2015-04-07 17:39:27

1. Совмещение чистого бланка с заполненным (очистка, контраст, размер, поворот).
2. Вычитание (из заполненного бланка чистого).
3. Пересечение "островного" шаблона областей (где должны быть надписи) с результатом п.2 и выявление заполненных и не заполненных полей.
4. Профит!

Answer 3 · 2015-04-07 16:39:32

olamedia . @w999d

Web-developer

OCR

Ответ написан более трёх лет назад

Комментировать

Answer 4 · 2015-04-07 20:37:56

Легче всего как мне кажется:

Определить верх документа по 1й строке
Выравнивание документа по 1й строке
Определение наличия "шрифта другого цвета" ( синий, красный, зелёный ) - в определённых координатах

Распознавание сканированной копии документа на веб сайте! С чего начать?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт