Как решить проблему с написанием цикла обработки?

Question

AnteFil @AnteFil

Python

Как решить проблему с написанием цикла обработки?

Есть вот такой код который берет все изображения в папке и сравнивает все между собой.

from sentence_transformers import SentenceTransformer, util
from PIL import Image
import glob
import os
# Load the OpenAI CLIP Model
print('Loading CLIP Model...')
model = SentenceTransformer('clip-ViT-B-32')
# Next we compute the embeddings
# To encode an image, you can use the following code:
# from PIL import Image
# encoded_image = model.encode(Image.open(filepath))
image_names = list(glob.glob('./*.jpg'))
print("Images:", len(image_names))
encoded_image = model.encode([Image.open(filepath) for filepath in image_names], batch_size=128, convert_to_tensor=True, show_progress_bar=True)
# Now we run the clustering algorithm. This function compares images aganist 
# all other images and returns a list with the pairs that have the highest 
# cosine similarity score
processed_images = util.paraphrase_mining_embeddings(encoded_image)
NUM_SIMILAR_IMAGES = 10 
# =================
# DUPLICATES
# =================
print('Finding duplicate images...')
# Filter list for duplicates. Results are triplets (score, image_id1, image_id2) and is scorted in decreasing order
# A duplicate image will have a score of 1.00
# It may be 0.9999 due to lossy image compression (.jpg)
duplicates = [image for image in processed_images if image[0] >= 0.999]
# Output the top X duplicate images
for score, image_id1, image_id2 in duplicates[0:NUM_SIMILAR_IMAGES]:
    print("\nScore: {:.3f}%".format(score * 100))
    print(image_names[image_id1])
    print(image_names[image_id2])
# =================
# NEAR DUPLICATES
# =================
print('Finding near duplicate images...')
# Use a threshold parameter to identify two images as similar. By setting the threshold lower, 
# you will get larger clusters which have less similar images in it. Threshold 0 - 1.00
# A threshold of 1.00 means the two images are exactly the same. Since we are finding near 
# duplicate images, we can set it at 0.99 or any number 0 < X < 1.00.
threshold = 0.99
near_duplicates = [image for image in processed_images if image[0] < threshold]
for score, image_id1, image_id2 in near_duplicates[0:NUM_SIMILAR_IMAGES]:
    print("\nScore: {:.3f}%".format(score * 100))
    print(image_names[image_id1])
    print(image_names[image_id2])

Мне нужно что бы один файл сравнивался со всеми остальными. Мои познания не очень по этому я только с помощью гугл пишу. Нагуглил вот
Открываю пути к изображениям из файла

filename = "massiv_img.txt"
# Открываем файл для чтения
with open(filename, "r") as f:
    # Считываем все строки из файла и сохраняем их в список
    image_names = [line.rstrip() for line in f]

Я создал список затем получаю изображение которое нужно сравнить
query_image = Image.open('2323.jpg')
Дальше не могу ни чего на гуглить помогите пожалуйста

Вот здесь затуп. Должно быть что то вроде такого
Картинка №1 сравнивается с Картинкой №2 итог сходство 10%
Картинка №1 сравнивается с Картинкой №3 итог сходство 10%
Картинка №1 сравнивается с Картинкой №4 итог сходство 10%
Картинка №1 сравнивается с Картинкой №5 итог сходство 10%
Картинка №1 сравнивается с Картинкой №6 итог сходство 10%

.............
Вот так должно быть

Вопрос задан более двух лет назад
80 просмотров

2 комментария

Подписаться 1 Простой 2 комментария

Пригласить эксперта

Ответы на вопрос 2

4 комментария

Vindicar @Vindicar

Хэш найдёт идентичные побайтово файлы.
Могут быть различия в метаданных (у JPEG и PNG они есть), а могут быть и просто near-duplicates, которые отличаются незначительно. Автор не удосужился описать задачу, конечно.

Написано более двух лет назад
Алан Гибизов @phaggi Куратор тега Python

Vindicar, если он построчно текстово будет сравнивать бинарники, как в его коде… будет еще хуже.

Написано более двух лет назад
Vindicar @Vindicar

Алан Гибизов, я этого в коде не вижу? Он построчно открывает текстовый список файлов. А в верхнем фрагменте изображения он открывает только через Image.open(filepath).

Написано более двух лет назад
Алан Гибизов @phaggi Куратор тега Python

Vindicar, а, точно. Я невнимательно посмотрел, краем глаза, и не приходя в сознание ляпнул. Согласен.

Написано более двух лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Средний
Как подключить отладчик к программе на Python в Docker-контейнере?
- 1 подписчик
- вчера
- 99 просмотров
0

ответов
Python

Простой
Почему не получается создать профиль в программе DolphinAnty?
- 1 подписчик
- вчера
- 60 просмотров
1

ответ
Python

Простой
Как совместить два .pdf файла?
- 1 подписчик
- 22 июл.
- 205 просмотров
0

ответов
Python

+1 ещё

Простой
Не доходит колбэк в колбекобработчик, как можно решить эту проблему?
- 1 подписчик
- 22 июл.
- 111 просмотров
1

ответ
Python

Простой
Почему AnaConda или MiniConda автоматически самоликвидируется на win10?
- 1 подписчик
- 22 июл.
- 95 просмотров
0

ответов
Python

+1 ещё

Простой
Почему форма не по центру экрана, как исправить?
- 1 подписчик
- 22 июл.
- 79 просмотров
0

ответов
Python

Простой
Как исправить Python error module 'win32crypt' has no attribute 'CryptProtectData' [closed]?
- 1 подписчик
- 21 июл.
- 75 просмотров
0

ответов
Python

+1 ещё

Простой
Как торговать фьючерсами через API MEXC?
- 2 подписчика
- 19 июл.
- 398 просмотров
1

ответ
Python

+1 ещё

Простой
Есть ли кд на отправку подарков от имени бота?
- 2 подписчика
- 19 июл.
- 198 просмотров
1

ответ
Python

+2 ещё

Простой
Как сделать символьные вычислениями в питоне для поиска стационарных точек системы диффуров?
- 1 подписчик
- 16 июл.
- 212 просмотров
0

ответов
Показать ещё Загружается…

Python разработчик

Bell Integrator • Москва

Разработчик Python

Bell Integrator • Москва

Python разработчик

Bell Integrator • Москва

Вы нарушаете пункт 3.1 правил. Уберите лишние теги или вопрос будет удалён.
Ну для начала, что значит "сравнивать"? По какому критерию? Побайтовое совпадение? Одна и та же сцена с разных ракурсов? Похожие цвета?

Answer 1 · 2023-05-07 11:43:11

Сравнивать файлы проще всего по hash. Совпали - одинаковые, не совпали - не одинаковые. Поищите, как считать md5, это встроенная в python функция; затем просто вычислите hash для целевого файла и для каждого сравниваемого - и если hash совпали - одинаковые файлы.

Answer 2 · 2023-05-07 17:38:42

AnteFil @AnteFil Автор вопроса

Мне надо цикл просто изменить!

Ответ написан более двух лет назад

Комментировать

Как решить проблему с написанием цикла обработки?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт