Это просто волшебно, то есть есть люди, считающие что если они отсканируют 2 раза 1 лист, то получат 2 совпадающих изображения... Хм, интересно...
Изображения будут сильно разными, вы сканируете лист, потом на нем пишут/пляшут/пьют кофе, снова пихают в сканер, но уже под другим углом, сканируют и сравнивают... Да просто отсканил - вытащил - вложил будет серьезно отличаться. Функция которая будет все это РАСПОЗНАВАТЬ и при этом лопатить все картинки котрые там есть - это явно какой-то аццкий ад.
Неужели не проще каждому документу завести в базе/файле запись с id, именем документа, именем файла, датой и комментариями, и нормально все это хранить???