В проекте, в том числе и для внутреннего пользования используется Elasticsearch. Есть задача:
У нас есть картинка товара 500х500 со стороннего сайта. У нас есть картинки (файлы) товаров, но размерами 1024х1024 (размеры могут быть разными). Задача: загружаем изображение товара - получаем идентичную картинку из нашей базы.
Можете, пожалуйста, подсказать туториал или может быть сервис, который может решить нашу задачу?
Можно использовать алгоритм на подобие dhash. Считаете сигнатуры к картинкам в вашей базе (один раз). Считаете сингатуру для картинки на входе и ищете по сигнатуре в базе. blog.iconfinder.com/detecting-duplicate-images-usi...
Поиск по хэшам очень быстр и подходит лутше всего для поиска "очевидных" дубликатов.
Здесь речь идет, насколько я понял, о похожих картинках. это не совсем одно и тоже.
Дубликаты=похожие картинки, похожие картинки!=дубликаты, покрайней мере не всегда.