на картинке-запросе изображена девушка в юбке. Программа в этом случае должна выдать фотографии девушек в юбке
очевидно что задача в поиске именно девушек в юбке или универсальнее?
пример, как алгоритм должен понять что пользователь ищет девушек в юбке, а не столы, рядом с которыми стоит девушка?
Гугли задачу - image annotation
с помощью нейронных сетей (именно эта технология сейчас бурно развивается в разрезе работы с фото и изображениями)
добавление в поисковую базу изображения должно начинаться с его анализа и получения списка тегов, объектов, которые нейронная сеть может на нем найти, и уже после ищешь по этим ключевым словам