Хочу создать ИИшку, которая будет постоянно запоминать, что с ней происходит(картинки, описания и тд.) и сохранять в базу. Понимаю, что невозможно все запоминать, но хотя бы 1-2 картинки+описания в секунду.
Все картинки из базы памяти я храню в sqlite в виде векторного представления, который создает CLIP(для уточнения который openAI сделали) для меньшего размера, а также чтобы сравнивнивать картинки для анализа и еще архивирую базу sqlite. Подскажите, пожалуйста, как еще можно сузить размер векторов?
Пока мы не знаем что за изображения, в чем их характерность и главное для каких задач их нужно хранить, помочь будет нечем.
Зачем ты в базе хранишь векторное представление? Ты так дубликаты ищешь. Вектор кстати это наименьшее из возможных по размеру представлений изображения, уменьшение его потребует либо больше обучающих данных и увеличение ресурсов на обучение, либо смириться с ухудшением его качества
Несколько мыслей.
- sqlite - это не база для BigData.
- в клипе не будет смысла. А для сравнения картинок - поищи что такое perceptual hash. Статья была гдето.
mayton2019, из изображения получается вектор и все операции поиска делаются по таким же, как и этот.
Полагаю, что речь об этой модели: https://openai.com/index/clip/