Допустим ... с pdf сложнее оперировать имхо, допустим конвертим всё в любой удобный графический формат. Далее остается задача кадрирования отдельных марок и их сравнение, с учетом того, что сканировать люди могут с различным dpi. разными сканерами и т.п. Ну например сервисы Google/Yandex.Картинки как то ищет "похожие" изображения, но результат поиска не всегда выдает желаемое. Наверное ваш поиск вряд ли будет работать лучше......... Устроит ли вас такой "функционал"?
p.s. часто на марках есть какой то текст, можно попробовать его распознавать и сравнивать межд разными изображениями, может это чуток улучшит "качество" сравнения.....