@maksam07

Как получить "хеш"/сравнить изображение?

Добрый день. Задача такова: уменьшить количество дублирующихся изображений на сервере (wordpress, если это важно).
Есть новостной сайт, иногда у новостей могут проскакивать одни и те же изображения, которые каждый раз были загружены повторно, хотя они 1в1 (или около того) похожи. Я хочу при загрузке изображений, записывать некий хеш в БД, и если я буду загружать подобное изображение снова, чтобы система мне сообщала, что такое изображение уже существует. На счет получения хеша изображения, может быть эта задача и не сложная, но как быть с такими дублями, если размер/пиксели и прочие мелочи могут не значительно отличаться?
Можете дать направление, как можно сравнивать изображения на сервере, чтобы уменьшить количество дублей?
  • Вопрос задан
  • 393 просмотра
Решения вопроса 1
iMedved2009
@iMedved2009
Не люблю людей
Гуглить perceptual hash.

Одна из реализаций

https://github.com/jenssegers/imagehash
Ответ написан
Пригласить эксперта
Ответы на вопрос 5
ipatiev
@ipatiev Куратор тега PHP
Потомок старинного рода Ипатьевых-Колотитьевых
@alexalexes
Для ведения новостей прежде всего нужно определить порядок, как создавать каталоги для хранения сопутствующего контента для людей, кто ведет их. Если плагин галереи не берет на себя обязанность автоматически создавать каталоги под свои нужды и не скрывает это от контент-менеджера, то контент-менеджер (человек) тупо складывает картинки в один каталог.
На моей практике я делаю так.
Под новости создаю каталог news, в каталоге на каждый год создаю каталог года - 2023.
Внутри каталога года создается каталог конкретной новости, который создается менеджером для новости, если требуется положить дополнительный контент. Обычно, имя у него такое: YYYY_MM_DD_NN, где YYYY - год, MM - месяц, DD - день, NN - порядковое число новости в один день.
Для повторяющегося контента можно задать каталог по умолчанию в news, например default, и складывать туда часто используемые изображения, заглушки и т.д.
И самое, главное, чтобы эту практику поддерживали менеджеры, тогда проблем с дублированием не будет, и не будет бардака в новостях.
Ответ написан
Stalker_RED
@Stalker_RED
На хабре есть несколько статей, и с самописными решениями и с готовыми инструментами.
https://www.google.com/search?q=habr+%D1%81%D1%80%...
Ответ написан
Комментировать
@Refguser
Решения для бизнеса: от создания ИМ до...
Чтобы не изобретать кривые велосипеды https://wordpress.org/plugins/media-deduper/
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы