Для работы с изображением 1000 фотографий может оказаться недостаточно
Вместо подсовывания в качестве входов пикселов изображения, лучше выделить какие то параметры из фото, и уже на их основе попробовать обучить сеть
Смотришь как работают
алгоритмы распознования и к примеру используя 'метод главных компонент' получаешь вектор параметров, однозначно определяющий лицо, и уже на основе его как входные параметры, добавив выходной вектор классификатор (по каждому украшению свой элемент вектора, 0 - не понравилось, 1 понравилось). Вполне возможно что конкретно на основании лица решение не получится найти, потому что нет такой зависимости. Докидывай во входной вектор как можно больше информации о клиентах, даже время покупки может оказаться важным.
С украшениями так же можно поступить, либо вручную либо теми же алгоритмами, выделить из украшений какие то определяющие их параметры, в этом случае сеть будет искать именно параметры 'подходящих украшений' а не конкретные (это лучше, так как для добавления нового украшения не придется переобучать сеть)