Как найти одно изображение на другом изображении?

Question

Вадимка))) @VadimCoder

Как найти одно изображение на другом изображении?

Мне надо, чтобы программа находила конкретный обьект на скриншоте, и возвращала его координаты. Обьект это другое изображение, которое лежит в папке с программой. Программа должна находить обьект, даже если он повернут под углом и другого цвета. Как это реализовать на Python? Готов изпользовать сторонние библиотеки и готовые решения.
!!! ОБЬЕКТОВ БУДЕТ МНОГО !!!

вот это скриншот.

а это программа должна найти.

Вопрос задан более трёх лет назад
1326 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Решения вопроса 1

2 комментария

Пригласить эксперта

Ответы на вопрос 1

4 комментария

Вадимка))) @VadimCoder Автор вопроса

Все это хорошо, чудесно и замечательно, НО, на сцене куча таких обьектов.

Написано более трёх лет назад
Vindicar @Vindicar

Вадимка))), сам виноват. Я ответил на поставленный вопрос. Про множественные объекты на сцене там не то что ни слова - даже ни намёка нет.

Скорее всего одним алгоритмом дело не ограничится, придётся сначала искать примерное расположение объектов - например, преобразованием Хафа, или на основании знания о предыдущем его расположении.
А потом уже уточнять позицию и ориентацию либо по особым точкам, либо template matching'ом, либо ещё как-то.

Написано более трёх лет назад
Вадимка))) @VadimCoder Автор вопроса

Vindicar, Я тебя не виню, хороший ответ, пригодится, но в данной ситуации не подходит.

Написано более трёх лет назад
Вадимка))) @VadimCoder Автор вопроса

Вадимка))), А то, что я вопрос не написал про множественные объекты - да, сам виноват.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Средний
Как генерировать качественные изображения в stable diffusion используя python?
- 2 подписчика
- вчера
- 287 просмотров
0

ответов
Python

+1 ещё

Простой
Какова временная сложность del[pos:] для списка в Python?
- 1 подписчик
- 04 июл.
- 171 просмотр
1

ответ
Python

Простой
Не копятся ли строки в памяти при работе с python?
- 1 подписчик
- 04 июл.
- 188 просмотров
2

ответа
Python

Простой
Как получить детальные данные по лицу с фото?
- 1 подписчик
- 03 июл.
- 127 просмотров
3

ответа
Python

+1 ещё

Средний
Извлечение информации о сохраненных бэкапах в google drive?
- 1 подписчик
- 03 июл.
- 59 просмотров
1

ответ
Python

Простой
Как вставить переменную в re.sub?
- 1 подписчик
- 03 июл.
- 94 просмотра
1

ответ
Python

+2 ещё

Средний
Почему не отображается inline keyboard при редактировании сообщения?
- 1 подписчик
- 02 июл.
- 551 просмотр
1

ответ
Python

+2 ещё

Средний
Из-за ошибки текстовый файлик занимает всё свободное место на носителе, как это исправить?
- 1 подписчик
- 01 июл.
- 510 просмотров
3

ответа
Python

+1 ещё

Простой
Как искать primary в реплике Монги?
- 1 подписчик
- 28 июн.
- 94 просмотра
0

ответов
Python

+1 ещё

Простой
Есть ли способ, получать прямые ссылки на видео VK для скачивания на Python?
- 1 подписчик
- 25 июн.
- 270 просмотров
1

ответ
Показать ещё Загружается…

Ведущий Python разработчик

Сбер • Москва

от 200 000 до 250 000 ₽

Python разработчик

DevTeam.Space

от 1 500 до 3 000 $

Стажер Python разработчик, музыкально грамотный

Vocaberry

от 20 000 до 20 000 ₽

Answer 1 · 2021-09-19 15:08:26

Владимир Куц @fox_12 Куратор тега Python

Расставляю биты, управляю заряженными частицами

Template matching

Ответ написан более трёх лет назад

2 комментария

Answer 2 · 2021-09-19 15:20:12

Терминология для гуглинга: "Локализация объекта методами компьтерного зрения".
В качестве инструментария можешь использовать opencv. Для питона это pip пакет python-opencv (импортируется под именем cv2).

Чтобы обойти проблему цвета, переведи входное изображение в оттенки серого, и потом, если оптребуется, добавь пороговое преобразование, чтобы оставить только чёрный и белый.

Подходы существуют разные. Если не требуется дикоре быстродействие, то можно использовать детектор SIFT.
Тогда у тебя будет алгоритм вида:
0. Создаёшь детектор (функция cv2.SIFT.create()) и матчер (можно cv2.BFMatcher(), он тормознутый но простой в использовании).
1. Грузишь образец искомого объекта и преобразуешь изображения (палитра серого, и т.п.)
2. Вызываешь метод детектора .detectAndCompute(), чтобы получить найденные особые точки (углы и т.п.) и их описание.
3. Повторяешь шаги 1,2 для анализируемого изображения (сцены).
4. У матчера вызываешь метод .knnMatch() c n=2. Это даст тебе 2 лучших совпадения между образцом и сценой по каждой особой точке.
5. Можно просто брать лучшее совпадение, а можно отсеять те особые точки, у которых два ближайших совпадения слишком похожи - они отсеялись.
Так или иначе, у тебя должен получиться список пар точек вида "точка на образце - найденная похожая точка на сцене".
6. Используешь функцию cv2.findHomography() или одну из родственных ей, чтобы найти матрицу преобразования. Грубо говоря, она позволит пересчитать позицию пикселя на изображении образца в позицию пикселя на изображении сцены.
Примерно так, если представить это наглядно (чтобы получить такую картинку, нужно еще несколько шагов, но она передаёт идею).

7. Дальше ты можешь использовать эту матрицу как хочешь. Например, возьми координаты центра объекта на изображении-образце, и используй её вместе с cv2.perspectiveTransform(), чтобы найти, где на сцене координаты точки центра объекта. Взяв ещё точку (в углу или на краю), сможешь найти ориентацию.

Проблема в том, что этот подход работает ТОЛЬКО если в сцене не более одного похожего объекта.

Код не привожу, набросай черновик сам, тогда можно будет его обсудить и подкорректировать. Если что, в сети можно много найти инфы по использованию opencv для решения этой задачи.

Как найти одно изображение на другом изображении?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт