Ответы пользователя Vindicar по тегу «OpenCV» — Хабр Q&A

Задать вопрос

Ответы пользователя по тегу OpenCV

Детектор движения отдельных объектов OpenCV на Python, как можно реализовать?

Vindicar @Vindicar
RTFM!

Такой вопрос уже был, повторю свой ответ: создай изображение-маску, и по этой маске закрашивай одним цветом неинтересные тебе части кадра перед их отправкой на сравнение. В закрашенных частях движения не будет по определению.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как в OpenCV сделать постройку грида с обновляемыми фото?

Vindicar @Vindicar
RTFM!

Изображение в opencv-python - это numpy массив, там можно обновлять области с помощью срезов.
Например, прямоугольная область с левым верхним углом (X;Y) и размером W x H обновляется тривиально:
image[Y:Y+H, X:X+W] = new_content
При этом подразумевается что new_content имеет размер W x H и такое же число каналов.

Т.е. можно для каждого изображения в сетке хранить его позицию, и обновлять его область отдельно.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Возникает проблема с фреймворком opencv python, почему?

Vindicar @Vindicar
RTFM!

Проверяй значение ret. Если оно не истинно, то кадр получить не удалось. Что в этом случае будет в img - хороший вопрос.
Может быть, камера занята каким-то другим процессом. Например, предыдущей копией твоей программы.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как заменить цвет пикселей cv2?
Vindicar @Vindicar
RTFM!
В cv2 изображения - это массивы numpy, так что все трюки с индексацией из numpy работают. Очень советую их изучить.

find = 1,2,3 # какие значения заменять replace = 4,5,6 # на какие значения заменять mask = (bgr == find)[..., 0] bgr[mask] = replace

Ответ написан более трёх лет назад

8 комментариев
8 комментариев
Python, OpenCV, tkinter все окна в одном, как реализовать?
Vindicar @Vindicar
RTFM!
Ну так собери изображения в одно, в чём проблема?
Пусть ты хочешь сделать такую сетку:

A B C D

Тогда ширина итогового изображения R будет max(A.shape[1]+B.shape[1], C.shape[1]+D.shape[1]), а высота max(A.shape[0]+C.shape[0], B.shape[0]+D.shape[0])
Отступ по X для изображений B и D будет max(A.shape[1], C.shape[1]), отступ по Y для C и D будет max(A.shape[0], B.shape[0]).
Ну а перенос прямоугольной области из массива в массив в numpy делается тривиально.

R[0:A.shape[0], 0:A.shape[1]] = A R[0:B.shape[0], X:X+B.shape[1]] = B R[Y:Y+C.shape[0], 0:C.shape[1]] = C R[Y:Y+D.shape[0], X:X+D.shape[1]] = D

Ответ написан более трёх лет назад

Комментировать
Комментировать
Детектор движения на Python?

Vindicar @Vindicar
RTFM!

Выбирать область, в которой может быть сдвиг?

Формируете маску игнорируемых областей, по этой маске заливаете "ненужные" пиксели одним цветом, а потом уже обрабатываете. В залитых пикселях движения точно не будет. =)

Задача- у статичной студии выявлять не двинул ли ведущий декорации,

Т.е. нужно обнаружить сам факт движения, а не выделить область, где оно произошло?
Я бы прошелся небольшим blur'ом по эталонному кадру и по текущему, а потом попиксельно вычел. Остаток прогнать через пороговое преобразование, если есть заметное смещение - значит, что-то не так.
Но будет работать только если освещение не меняется, а в анализируемую зону не падает тень от ведущего.
Если декорации цветные, то это можно отчасти нивелировать, работая в системе цветности HSV по каналу Hue (оттенок), игнорируя Saturation (насыщенность) и Value (яркость).

Ответ написан более трёх лет назад

2 комментария

2 комментария
Как определять движение в движущейся камере python?

Vindicar @Vindicar
RTFM!

В общем и целом решения нет, так как отличить движение объекта от эффекта параллакса затруднительно, да и опираться на координаты тоже будет проблематично.
Ты можешь поэкспериментировать с оптическим потоком, чтобы попытаться понять, в каком направлении сместилась камера, и пытаться либо произвести контр-смещение кадра перед использованием mean of gaussians, либо отсеивать объекты, у которых величина собственного смещения слишком близка к найденному движению камеры (со знаком минус). Первое реально работает только при съёмке с рук стоящего человека, т.е. когда смещения сравнительно малы. Если нужно ловить движение, когда камера тоже движется в одном направлении, шансов очень мало.
Так или иначе, тебе наверняка придётся самому реализовывать тот или иной алгоритм background subtraction, чтобы иметь возможность вмешаться в его работу для компенсации движения.

Ответ написан более трёх лет назад

1 комментарий

1 комментарий
Как накладывать изображения в python?
Vindicar @Vindicar
RTFM!
Т.е. если переформулировать вопрос:
Есть два изображения (A и B) с одинаковым набором маркеров. Нужно трансформировать изображение B так, чтобы его маркеры совпали по положению с маркерами изображения A, а потом наложить результат на изображение A.
Я так понял?

Если да, то это делается примерно так.
1. Формируешь два массива координат - маркеры на изображениях A и B. Как - зависит от типа маркеров, но порядок должен быть одинаковым в обоих массивах. Форма (shape) массивов должна быть (N, 1, 2), где последний индекс отвечает за x или y координату, а N - число маркеров.
2. Вызываешь
homography, ptmask = cv2.findHomography(arrayB, arrayA, cv2.RANSAC)
.
homography будет матрицей проективного преобразования - как повернуть маркеры B, чтобы они легли на маркеры A. ptmask будет содержать сведения о том, какие пары точек удалось совместить.
3. Делаешь вызов cv2.warpPerspective(), чтобы повернуть изображение B согласно матрице homography. Параметр размера должен быть таким чтобы второе изображение точно уместилось вместе с первым. Например, можно заранее создать большое изображение по размеру.
4. Делаешь совмещение. Используешь cv2.PerspectiveTransform(), чтобы понять, где на итоговом изображении будут углы изображения B, делаешь cv2.fillPoly() чтобы создать бинарную маску для наложения. В маске белый пиксель будет означать "сюда поместить пиксель из повернутого B", а черный - "оставить пиксель как есть". Используешь эту маску, чтобы выполнить наложение.

Пример кода и исходных данных - не совсем то, что тебе нужно, но идею передаст, я надеюсь.

Ответ написан более трёх лет назад

3 комментария
3 комментария
Как работают Каскады Хаара в OpenCV?

Vindicar @Vindicar
RTFM!

«Признак Хаара» это прямоугольный фильтр, разделенный на две области – светлую и темную. Данный фильтр накладывается на некоторую область изображения (окно). Значением (откликом) признака является сумма яркостей пикселей изображения в светлой области минус сумма яркостей пикселей в темной области. Если эта разность превышает некоторый порог, то мы считаем, что данный фильтр дал отклик в данном месте изображения.
Это примитивный признак-классификатор. При обучении классификатора Хаара с помощью алгоритма бустинга набор таких примитивных классификаторов складывается в один составной классификатор. Но такой классификатор либо работает долго, либо даёт много ложных срабатываний. Даже шанс в 0,01% - это много, учитывая сколько возможнных окон (возможных позиций лица) может быть на изображении.
Поэтому использует принцип "каскада внимания". Формируется цепочка из нескольких составных классификаторов таким образом, чтобы каждый последующий отсеивал как можно больше отрицательных примеров, но при этом пропускал все или почти все положительные (уровень обнаружения >95%). Это позволяет ограничиться вычислением сравнительно быстрых и простых составных классификаторов для подавляющего большинства окон на изображении.

Под конец несколько близлежащих окон могут быть слиты в одно с помощью non-maximum suppression. Это нужно, так как лицо может попасть сразу в несколько соседних окон, чуть смещённых относительно друг друга.
Если в итоге у нас есть отклики, то мы знаем позиции и размеры возможных лиц на изображении. А дальше уже эвристика на основании этих сведений. Например, если нам нужен крупный план, то мы можем отвергнуть изображение, если наибольшее лицо занимает менее 75% площади изображения.

Ответ написан более трёх лет назад

4 комментария

4 комментария

Python cv2 как перести многомерный массив в картинку?

Vindicar

Vindicar @Vindicar

RTFM!

src = [['255', '255', '255', '190', '190', '160', '76', '45', '78'],
['255', '255', '255', '190', '190', '160', '76', '45', '78'],
['255', '255', '255', '190', '190', '160', '76', '45', '78']]

int_src = [ list(map(int, row)) for row in src ]
red = [ row[0::3] for row in src ] #подразумеваю, что у тебя составляющие идут в порядке RGB
green = [ row[1::3] for row in src ]
blue = [ row[2::3] for row in src ]
image = cv2.merge((blue, green, red)) #opencv по умолчанию хранит изображения в BGR, а не RGB

Ответ написан более трёх лет назад

Комментировать

Комментировать

Вопрос к знатокам opencv?

Vindicar @Vindicar
RTFM!

Сами - нет. Подбери один раз значение под свою задачу, и оставь его.
scaleFactor - это шаг масштабирования при поиске объектов разного видимого размера.
Чем он ближе к 1, тем более мелкие шаги делает алгоритм, тем больше этих шагов, тем дольше обрабатывается изображение. Чем он больше, тем быстрее обработка - но в то же время лицо "промежуточного" размера между парой шагов может быть потеряно.

Следует учесть, что лицо может "теряться" не только из-за этого параметра, но и из-за множества других факторов.

Ответ написан более трёх лет назад

Комментировать

Комментировать
Как найти одно изображение на другом изображении?

Vindicar @Vindicar
RTFM!

Терминология для гуглинга: "Локализация объекта методами компьтерного зрения".
В качестве инструментария можешь использовать opencv. Для питона это pip пакет python-opencv (импортируется под именем cv2).

Чтобы обойти проблему цвета, переведи входное изображение в оттенки серого, и потом, если оптребуется, добавь пороговое преобразование, чтобы оставить только чёрный и белый.

Подходы существуют разные. Если не требуется дикоре быстродействие, то можно использовать детектор SIFT.
Тогда у тебя будет алгоритм вида:
0. Создаёшь детектор (функция cv2.SIFT.create()) и матчер (можно cv2.BFMatcher(), он тормознутый но простой в использовании).
1. Грузишь образец искомого объекта и преобразуешь изображения (палитра серого, и т.п.)
2. Вызываешь метод детектора .detectAndCompute(), чтобы получить найденные особые точки (углы и т.п.) и их описание.
3. Повторяешь шаги 1,2 для анализируемого изображения (сцены).
4. У матчера вызываешь метод .knnMatch() c n=2. Это даст тебе 2 лучших совпадения между образцом и сценой по каждой особой точке.
5. Можно просто брать лучшее совпадение, а можно отсеять те особые точки, у которых два ближайших совпадения слишком похожи - они отсеялись.
Так или иначе, у тебя должен получиться список пар точек вида "точка на образце - найденная похожая точка на сцене".
6. Используешь функцию cv2.findHomography() или одну из родственных ей, чтобы найти матрицу преобразования. Грубо говоря, она позволит пересчитать позицию пикселя на изображении образца в позицию пикселя на изображении сцены.
Примерно так, если представить это наглядно (чтобы получить такую картинку, нужно еще несколько шагов, но она передаёт идею).

7. Дальше ты можешь использовать эту матрицу как хочешь. Например, возьми координаты центра объекта на изображении-образце, и используй её вместе с cv2.perspectiveTransform(), чтобы найти, где на сцене координаты точки центра объекта. Взяв ещё точку (в углу или на краю), сможешь найти ориентацию.

Проблема в том, что этот подход работает ТОЛЬКО если в сцене не более одного похожего объекта.

Код не привожу, набросай черновик сам, тогда можно будет его обсудить и подкорректировать. Если что, в сети можно много найти инфы по использованию opencv для решения этой задачи.

Ответ написан более трёх лет назад

4 комментария

4 комментария
Как обработать изображение через CV2?

Vindicar @Vindicar
RTFM!

Непонятно, что именно ты пытаешься сделать.
Если просто перевести скриншот в другое цветовое пространство, то вот этих двух строчек
image = pyautogui.screenshot(region=(514, 495, 264, 12))
image = cv2.cvtColor(np.array(image), cv2.COLOR_BGR2GRAY)
должно хватить.
Дальше crop лучше делать средствами cv2, благо для этого достаточно средств numpy-массивов (а именно так cv2 хранит изображения).

Ответ написан более трёх лет назад

3 комментария

3 комментария
Определение количества квадратов с пересечением?

Vindicar @Vindicar
RTFM!

Размер квадрата известен? Используй скользящее окно.
Вырезай поочерёдно все фрагменты изображения такого размера, если оно целиком чёрное - то фиксируем квадрат в этой позиции.

Могут быть ложные срабатывания, если два перекрывающихся квадрата расположены идеально на одной вертикали/горизонтали. Тут нужно искать все срабатывания в этой области, и выбирать крайнее левое/правое или нижнее/верхнее.

Ответ написан более трёх лет назад

Комментировать

Комментировать
При выводе изображения по CSV появляется ошибка. Что не так в моем коде?

Vindicar @Vindicar
RTFM!

img = cv2.imread('data/first/{}'.format(img_name))
mask = cv2.imread('data/mas/{}'.format(img_name))

Во-первых, стоит указать вторым параметром cv2.IMREAD_COLOR.
Во-вторых, проверь, что в итоге в img и mask.
В случае ошибки imread() молча возвращает None, а не кидает исключение.

Ответ написан более трёх лет назад

3 комментария

3 комментария
Не могу понять в чем ошибка?
Vindicar @Vindicar
RTFM!
face = cv2.cvtColor(face, cv2.COLOR_BGR2RGB) cv2.error: OpenCV(4.5.1) /tmp/pip-req-build-ms668fyv/opencv/modules/imgproc/src/color.cpp:182: error: (-215:Assertion failed) !_src.empty() in function 'cvtColor'

"Assertion failed" значит, не прошла впроверка входных данных.

"!_src.empty()" подсказывает, что входное изображение должно быть не пустым - а у тебя, выходит, пустое.

Ты делаешь frame[startY:endY, startX:endX] - вставь проверку, что startY != endY, а startX != endX.
Кроме того, стоит проверить, что ты действительно получил кадр через frame = vs.read().

Ответ написан более трёх лет назад

1 комментарий
1 комментарий

Самые активные сегодня

Drno
- 5 ответов
- 0 вопросов
rPman
- 3 ответа
- 0 вопросов
UN_Tony
- 1 ответ
- 1 вопрос
AndreKanevski
- 0 ответов
- 1 вопрос
Danila-fox
- 1 ответ
- 0 вопросов
freeeeez
- 0 ответов
- 1 вопрос