Как сравнить две картинки?

Question

Евгений Лубяной @arswarog

Как сравнить две картинки?

Есть бумажный документ, который со временем заполняется, его нужно периодически сканировать и отправлять нам.
Необходимо найти предыдущий скан в БД и заменить его на новый.
Формат простой - таблица, первый столбец - ф.и.о. от руки, первая строка - дата и время. все остальное - отметки

Мысли такие: формируем картинку по этой картинке, в которую попадает только та часть которая не меняется - т.е. первые 10 фамилий, заголовок (он от руки на бумаге записывается) и потом ищем копию этой картинки в таблице таких же картинок для других сканов.

При гуглинге нашел перцептивный хеш. Однако не уверен что он достаточно хорошо сможет справиться с задачей.
Собственно подскажите в какую сторону копать что бы найти предыдущую версию скана?
м.б. кто сталкивался с похожей задачей?

Вопрос задан более трёх лет назад
1502 просмотра

Комментировать

Подписаться 2 Оценить Комментировать

Помогут разобраться в теме Все курсы

Нетология

Веб-разработчик с нуля: профессия с выбором специализации

14 месяцев

Далее
Skillbox

Профессия PHP-разработчик с нуля до PRO

7 месяцев

Далее
Хекслет

PHP-разработчик

10 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 3

7 комментариев

Евгений Лубяной @arswarog Автор вопроса

вот стал бы я задавать вопрос, считая что оба изображения будут идентичны?

я наприсал код, который вытаскивает из картинки только саму таблицу, определяет и поворачивает изображение до полгой горизонтали (точность 0.1 градуса)

А хранить не получается - получилось бы я бы сюда не писал.
Спасибо!

Написано более трёх лет назад
ThunderCat @ThunderCat Куратор тега PHP

arswarog: ок, а что не получается хранить??? В чем собсно проблема хранения?

Написано более трёх лет назад
Евгений Лубяной @arswarog Автор вопроса

на документах не запишешь их номер, а при пересылке редко кто правильное имя файлу даст

Написано более трёх лет назад
ThunderCat @ThunderCat Куратор тега PHP

arswarog: есть идейка... как файлы приходят и с какой частотой?
И сколько накопилось? И как сейчас храните?

Написано более трёх лет назад
Евгений Лубяной @arswarog Автор вопроса

500-1000 неделю, пока что картиночками в папочках

Написано более трёх лет назад
ThunderCat @ThunderCat Куратор тега PHP

arswarog: почтой, скайпом, флешкой? От одного адресата или от 1000?

Написано более трёх лет назад
Евгений Лубяной @arswarog Автор вопроса

все флешкой. в целом в нормально именнованных папочках, но далеко не всегда. я потом их переименовываю и раскидываю по нужным папочкам

Написано более трёх лет назад

Комментировать

5 комментариев

ThunderCat @ThunderCat Куратор тега PHP

John Smith: имхо задача такая: присылают сканы, вводить их лень, искать руками еще ленивее, навести порядок 1 раз не так прикольно как показать миру(или шефу) вундервафлю самописную, которая как скатерть самобранка - пыщ-пыщ и все сделает. Имхо. Или не так дело обстоит, автор тут не уточнил что и нафига.

Написано более трёх лет назад
Евгений Лубяной @arswarog Автор вопроса

если не перцептивный хеш, то может еще можно использовать?
определить что это именно та страница, а данных на ней будет или столько же или больше
ThunderCat все как раз так, мне лень вводить и искать их самому, шефу пофиг, лишь бы нужный момент все было под рукой

Написано более трёх лет назад
ThunderCat @ThunderCat Куратор тега PHP

arswarog: в принципе - желание похвальное, все что можно автоматизировать нужно автоматизировать. Но тут пока возможности современного ии увы не позволяют. Проще навести порядок в системе, а вот как - пока мало данных.

Написано более трёх лет назад
dom1n1k @dom1n1k

Если сканируемые документы не произвольные, а собственного производства, то можно подумать в сторону того, чтобы где-то с краю листа печатать уникальный штрих-код и по нему распознавать... там хотя бы можно попробовать библиотеки поискать готовые.

Написано более трёх лет назад
Евгений Лубяной @arswarog Автор вопроса

идеи есть, в ближайшем времени буду тестировать

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

PHP

Простой
PDO не видит внутри функции?
- 1 подписчик
- вчера
- 126 просмотров
2

ответа
PHP

Средний
Как подключиться к серверу PHP и чтобы отображались исполнители?
- 1 подписчик
- 24 апр.
- 148 просмотров
2

ответа
PHP

+3 ещё

Средний
Как организовать автоматическую выдачу цифровых товаров после оплаты на чистом PHP?
- 2 подписчика
- 20 апр.
- 216 просмотров
3

ответа
PHP

Простой
Не работает яндекс ссылка прямая?
- 1 подписчик
- 07 апр.
- 199 просмотров
1

ответ
PHP

Простой
Почему слетает сайт при загрузке обработчика?
- 1 подписчик
- 02 апр.
- 222 просмотра
1

ответ
JavaScript

+2 ещё

Средний
Авторизация вконтакте как настроить?
- 2 подписчика
- 26 мар.
- 364 просмотра
1

ответ
PHP

Простой
СТРОКА — где искать ее истоки на сайте?
- 1 подписчик
- 11 мар.
- 376 просмотров
2

ответа
PHP

Простой
Есть ли такая функция сравнения?
- 2 подписчика
- 09 мар.
- 325 просмотров
1

ответ
JavaScript

+2 ещё

Простой
Как быть если ломается сайт, в зависимости от браузера?
- 1 подписчик
- 05 мар.
- 527 просмотров
1

ответ
PHP

Простой
Как отправить файл в Телеграм через OpenServer 6.5.0?
- 1 подписчик
- 02 мар.
- 248 просмотров
1

ответ
Показать ещё Загружается…

PHP-разработчик

Остров Сокровищ

от 15 000 до 250 000 ₽

Программист PHP

Базис-Центр • Коломна

от 70 000 до 250 000 ₽

Fullstack PHP Laravel/VueJS разработчик

Emsoft

До 150 000 ₽

Answer 1 · 2017-01-12 23:21:50

Это просто волшебно, то есть есть люди, считающие что если они отсканируют 2 раза 1 лист, то получат 2 совпадающих изображения... Хм, интересно...

Изображения будут сильно разными, вы сканируете лист, потом на нем пишут/пляшут/пьют кофе, снова пихают в сканер, но уже под другим углом, сканируют и сравнивают... Да просто отсканил - вытащил - вложил будет серьезно отличаться. Функция которая будет все это РАСПОЗНАВАТЬ и при этом лопатить все картинки котрые там есть - это явно какой-то аццкий ад.

Неужели не проще каждому документу завести в базе/файле запись с id, именем документа, именем файла, датой и комментариями, и нормально все это хранить???

Answer 2 · 2017-01-12 22:15:17

глянь https://www.npmjs.com/package/jimp
есть метод diff, можно кропать изображения, а вообще бумажка с галочками от руки, это жесть....

Answer 3 · 2017-01-12 23:10:55

Перцептивный хэш точно не годится - он больше пригоден для фотографий и т.п., чем для форм, заполненных закорючками.

Но вообще говоря, постановка задачи непонятна. Нужно сравнить просто по принципу равно/не равно? Или понять что именно изменилось? И почему нельзя искать сканы тупо по имени файла и дате (которую тоже можно включить в имя)?

Как сравнить две картинки?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт