Как работают Каскады Хаара в OpenCV?

Question

Pudjak @Pudjak

OpenCV

Как работают Каскады Хаара в OpenCV?

Можете на доступном языке объяснить, как это работает?
Вот допустим есть некоторое изображение, на котором нужно определить лица, и мы пропускаем его через этот алгоритм.
В нём мы имеем чёрно-белые маски и признаки размером 24 на 24. Ещё и 25 уровней каких-то есть.

Так и что в итоге с ними происходит?
Предполагаю типа признаком 24 на 24 проходимся по всему изображению. На каждом таком проходе ещё проходим и масками, чтобы определить может ли быть на этом месте лицо или нет (если так, то как?). В итоге имеем изображение с несколькими отметками 24 на 24, на которых по идее лицо. И как в итоге будет решено, есть ли на всём изображении это лицо?

Вопрос задан более трёх лет назад
110 просмотров

Комментировать

Подписаться 1 Простой Комментировать

Помогут разобраться в теме Все курсы

Нетология

1C-программист: расширенный курс

18 месяцев

Далее
Академия Эдюсон

Python-разработчик + ИИ

9 месяцев

Далее
ProductStar × РБК

Профессия DevOps-инженер + ИИ

5 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 1

4 комментария

Pudjak @Pudjak Автор вопроса

Так ну то есть у нас есть окно (размером 24 на 24 в xml файлах каскадов хаара). Этим окном мы смещаясь по одному пикселю проходим по всему изображению. Если в окне сумма яркостей проходит порог, то это место становится слабым классификатором. Пройдя по всему изображению получаем множество слабых классификаторов. Затем слабые классификаторы объединяются в сильный (вот тут не пойму, каким образом). А вот дальше уже чёт не могу понять, что происходит.

Написано более трёх лет назад
Vindicar @Vindicar

Pudjak, нет, нет.
Окно - это прямоугольник 24х24 внутри изображения.
Каждый признак Хаара - это слабый классификатор. Он даёт отклик на тех окнах изображения, где распределения яркостей похоже на распределение яркостей в признаке.
С помощью алгоритмов бустинга (типа AdaBoost) можно объединить несколько слабых классификаторов в один более сильный. Грубо говоря, суммируем их отклики с некоторым весом, и по полученной сумме делаем вывод - похоже / не похоже. Таким образом, набор отдельных признаков Хаара начинает работать как единое целое, выделяя те окна, в которых сложное распределение яркости похоже на желаемое.

Написано более трёх лет назад
Pudjak @Pudjak Автор вопроса

Vindicar, Ну а вот этим "окном" же мы всё равно проходимся по всему изображению, просто смещая постепенно в сторону и вниз? Посмотрели первое окно, отклика от классификатора нет, передвинулись на пиксельный столбец правее и опять проверяется отклик уже на следующем окне, и так пока не обойдётся всё изображение.
По идее же в итоге и получается, что размер "окна" этого и будет размером самого прямоугольного фильтра (признака).

Написано более трёх лет назад
Vindicar @Vindicar

Pudjak, именно, это называется метод скользящего окна.
Для поиска лиц разного размера просто уменьшаем изображение в N раз (N не обязательно целом, можно уменьшать на 20%, например) и проходимся еще раз.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Python

+3 ещё

Простой
Есть решение сборки Python в Exe с библиотекой Opencv?
- 1 подписчик
- 09 сент. 2025
- 297 просмотров
1

ответ
Python

+2 ещё

Средний
Нужно дополнить код в Python. Как добавить значения к цветам или выделить контуры более детально с прикреплением значений?
- 2 подписчика
- более года назад
- 502 просмотра
0

ответов
Windows

+4 ещё

Средний
Почему эмуляция кликов мыши через SendInput блокируется после трёх срабатываний?
- 1 подписчик
- более года назад
- 410 просмотров
1

ответ
OpenCV

Простой
Как сделать поиск объектов на скриншоте из игры?
- 1 подписчик
- более года назад
- 197 просмотров
3

ответа
OpenCV

Средний
Как реализовать алгоритм заливки в openCV python, как в фотошопе?
- 1 подписчик
- более года назад
- 94 просмотра
0

ответов
OpenCV

Простой
Почему при записи видео через opencv файл выходит испорченным?
- 1 подписчик
- более года назад
- 101 просмотр
0

ответов
C#

+2 ещё

Средний
Возможно ли отобразить окно openCV на python в окне WPF c#?
- 1 подписчик
- более года назад
- 138 просмотров
1

ответ
Нейронные сети

+2 ещё

Простой
Методы для поиска объектов на изображениях?
- 3 подписчика
- более года назад
- 834 просмотра
1

ответ
Python

+1 ещё

Средний
Как определить координаты совпадающих фигур?
- 1 подписчик
- более года назад
- 131 просмотр
2

ответа
Python

+1 ещё

Средний
Как найти паттерн на картинке с OpenCV?
- 1 подписчик
- более года назад
- 226 просмотров
2

ответа
Показать ещё Загружается…

Answer 1 · 2021-12-03 12:22:37

«Признак Хаара» это прямоугольный фильтр, разделенный на две области – светлую и темную. Данный фильтр накладывается на некоторую область изображения (окно). Значением (откликом) признака является сумма яркостей пикселей изображения в светлой области минус сумма яркостей пикселей в темной области. Если эта разность превышает некоторый порог, то мы считаем, что данный фильтр дал отклик в данном месте изображения.
Это примитивный признак-классификатор. При обучении классификатора Хаара с помощью алгоритма бустинга набор таких примитивных классификаторов складывается в один составной классификатор. Но такой классификатор либо работает долго, либо даёт много ложных срабатываний. Даже шанс в 0,01% - это много, учитывая сколько возможнных окон (возможных позиций лица) может быть на изображении.
Поэтому использует принцип "каскада внимания". Формируется цепочка из нескольких составных классификаторов таким образом, чтобы каждый последующий отсеивал как можно больше отрицательных примеров, но при этом пропускал все или почти все положительные (уровень обнаружения >95%). Это позволяет ограничиться вычислением сравнительно быстрых и простых составных классификаторов для подавляющего большинства окон на изображении.

Под конец несколько близлежащих окон могут быть слиты в одно с помощью non-maximum suppression. Это нужно, так как лицо может попасть сразу в несколько соседних окон, чуть смещённых относительно друг друга.
Если в итоге у нас есть отклики, то мы знаем позиции и размеры возможных лиц на изображении. А дальше уже эвристика на основании этих сведений. Например, если нам нужен крупный план, то мы можем отвергнуть изображение, если наибольшее лицо занимает менее 75% площади изображения.

Как работают Каскады Хаара в OpenCV?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт