Столкнулся с проблемой дубликатов изображений.
Когда имеется два одинаковых изображения, но одно в разрешении 500x500 - другое 1000x1000. Возможно ли (и чем) найти эти дубликаты.
И ещё, чем можно среди тысяч изображений достать лишь те, в которых присутствует один и тот же объект? (к примеру одно и тоже лого, Одинаковое на всех изображениях)
Самое простое:
Масштабируем до какого-то стандартного размера (254х254 напр).
Разбиваем сеткой NхN, на тайлы.
Считаем в каждом тайле средний цвет
Записываем разницу цветов от очередного тайла (первый нах) с неким порогом чуствительности.
Получаем ряд чисел, который уже можно назвать характеристикой изображения.
Это первое что приходит в голову, если задачу нужно решить быстро и не заморачиваясь с фрактальным кодированием изображений.