Как найти одно изображение на другом изображении?

Question

Вадимка))) @VadimCoder

Как найти одно изображение на другом изображении?

Мне надо, чтобы программа находила конкретный обьект на скриншоте, и возвращала его координаты. Обьект это другое изображение, которое лежит в папке с программой. Программа должна находить обьект, даже если он повернут под углом и другого цвета. Как это реализовать на Python? Готов изпользовать сторонние библиотеки и готовые решения.
!!! ОБЬЕКТОВ БУДЕТ МНОГО !!!

вот это скриншот.

а это программа должна найти.

Вопрос задан более трёх лет назад
1347 просмотров

Комментировать

Подписаться 1 Средний Комментировать

Решения вопроса 1

2 комментария

Пригласить эксперта

Ответы на вопрос 1

4 комментария

Вадимка))) @VadimCoder Автор вопроса

Все это хорошо, чудесно и замечательно, НО, на сцене куча таких обьектов.

Написано более трёх лет назад
Vindicar @Vindicar

Вадимка))), сам виноват. Я ответил на поставленный вопрос. Про множественные объекты на сцене там не то что ни слова - даже ни намёка нет.

Скорее всего одним алгоритмом дело не ограничится, придётся сначала искать примерное расположение объектов - например, преобразованием Хафа, или на основании знания о предыдущем его расположении.
А потом уже уточнять позицию и ориентацию либо по особым точкам, либо template matching'ом, либо ещё как-то.

Написано более трёх лет назад
Вадимка))) @VadimCoder Автор вопроса

Vindicar, Я тебя не виню, хороший ответ, пригодится, но в данной ситуации не подходит.

Написано более трёх лет назад
Вадимка))) @VadimCoder Автор вопроса

Вадимка))), А то, что я вопрос не написал про множественные объекты - да, сам виноват.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+1 ещё

Простой
Как создать параметризированный SQL запрос через pyodbc к Mysql?
- нет подписчиков
- 7 часов назад
- 70 просмотров
2

ответа
Python

+1 ещё

Простой
Как сделать экранирование символов в Python для SQL запроса?
- 1 подписчик
- 10 часов назад
- 87 просмотров
1

ответ
Python

Простой
Что можно ускорить в коде решателя игры крестики нолики?
- 1 подписчик
- 18 часов назад
- 126 просмотров
0

ответов
Python

Простой
Как подключиться по SMTP к Reg ru?
- 1 подписчик
- вчера
- 120 просмотров
0

ответов
Python

+1 ещё

Простой
Как имитировать нажатие пкм в неактивное окно DirectX?
- 1 подписчик
- вчера
- 37 просмотров
1

ответ
Python

+1 ещё

Простой
Как настроить группы при создании нового пользователя в битриксе?
- 1 подписчик
- 14 авг.
- 109 просмотров
0

ответов
Python

+1 ещё

Простой
При добавления строчки @commands.has_permissions в терминале при запуске выдает ошибку?
- 1 подписчик
- 14 авг.
- 85 просмотров
0

ответов
Python

+1 ещё

Простой
Можно ли отключить SSL сертификат при парсинге?
- 1 подписчик
- 13 авг.
- 127 просмотров
0

ответов
Python

Простой
Не работает код, что делать?
- 2 подписчика
- 10 авг.
- 2120 просмотров
4

ответа
Python

Простой
Почему консольная программа перестает работать спустя время?
- 3 подписчика
- 08 авг.
- 2294 просмотра
3

ответа
Показать ещё Загружается…

Ведущий Python разработчик

Сбер • Москва

от 200 000 до 250 000 ₽

Python Developer

Nomadic Soft

от 2 800 до 3 200 $

Python-разработчик (Senior)

BCraft

от 3 500 до 4 500 $

Answer 1 · 2021-09-19 15:08:26

Владимир Куц @fox_12 Куратор тега Python

Расставляю биты, управляю заряженными частицами

Template matching

Ответ написан более трёх лет назад

2 комментария

Answer 2 · 2021-09-19 15:20:12

Терминология для гуглинга: "Локализация объекта методами компьтерного зрения".
В качестве инструментария можешь использовать opencv. Для питона это pip пакет python-opencv (импортируется под именем cv2).

Чтобы обойти проблему цвета, переведи входное изображение в оттенки серого, и потом, если оптребуется, добавь пороговое преобразование, чтобы оставить только чёрный и белый.

Подходы существуют разные. Если не требуется дикоре быстродействие, то можно использовать детектор SIFT.
Тогда у тебя будет алгоритм вида:
0. Создаёшь детектор (функция cv2.SIFT.create()) и матчер (можно cv2.BFMatcher(), он тормознутый но простой в использовании).
1. Грузишь образец искомого объекта и преобразуешь изображения (палитра серого, и т.п.)
2. Вызываешь метод детектора .detectAndCompute(), чтобы получить найденные особые точки (углы и т.п.) и их описание.
3. Повторяешь шаги 1,2 для анализируемого изображения (сцены).
4. У матчера вызываешь метод .knnMatch() c n=2. Это даст тебе 2 лучших совпадения между образцом и сценой по каждой особой точке.
5. Можно просто брать лучшее совпадение, а можно отсеять те особые точки, у которых два ближайших совпадения слишком похожи - они отсеялись.
Так или иначе, у тебя должен получиться список пар точек вида "точка на образце - найденная похожая точка на сцене".
6. Используешь функцию cv2.findHomography() или одну из родственных ей, чтобы найти матрицу преобразования. Грубо говоря, она позволит пересчитать позицию пикселя на изображении образца в позицию пикселя на изображении сцены.
Примерно так, если представить это наглядно (чтобы получить такую картинку, нужно еще несколько шагов, но она передаёт идею).

7. Дальше ты можешь использовать эту матрицу как хочешь. Например, возьми координаты центра объекта на изображении-образце, и используй её вместе с cv2.perspectiveTransform(), чтобы найти, где на сцене координаты точки центра объекта. Взяв ещё точку (в углу или на краю), сможешь найти ориентацию.

Проблема в том, что этот подход работает ТОЛЬКО если в сцене не более одного похожего объекта.

Код не привожу, набросай черновик сам, тогда можно будет его обсудить и подкорректировать. Если что, в сети можно много найти инфы по использованию opencv для решения этой задачи.

Как найти одно изображение на другом изображении?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт