Откуда берутся значения для этой таблицы python?

Доброго времени суток, хочу реализовать алгоритм HOG, но не до конца понимаю теорию
Более менее теория показана на англоязычном видео:
https://youtu.be/28xk5i1_7Zc
То есть тут ничего сложного нет, орудая numpy и самописными алгоритмами спокойно все реализую
Но я никак не могу понять, откуда берутся вот эти вот значения(на фото обведены зелёным)5fa48e860fc35970079671.jpeg
Помогите пожалуйста разобраться
  • Вопрос задан
  • 153 просмотра
Пригласить эксперта
Ответы на вопрос 1
@101-s
Градиент - это переход от темного к светлому. Весь алгоритм направлен на выявление граней и угла поворота граней в ячейке 8х8. Грань как раз хорошо определяется с помощью градиента, там, где разность по яркости между соседними ячейками больше, там и будет грань, надеюсь не тупо объяснил.

Что выделено зеленым:
1. Алгоритм для каждой точки изображения считает направление градиента (угол вектора относительно оси x) и величину изменения градиента (плавный переход или резкий переход).
В видео это показано на следующем слайде. Подсчет ведется с помощью соседних точек и я так понял что не все точки нужны в подсчете, угловые отбрасываются. Другими словами это некое наложение фильтра на картинку

ЗЫ
2. Мы определили для каждой точки величину изменения градиента и его угол, теперь нам нужно обобщить, что благотворно скажется на качестве и скорости классификации, исходя их опыта авторов.
Для этого мы строим гистограмму градиентов для ячейки 8х8. (см дальше на видео) Также эту гистограмму можно представить в виде 9-размерного вектора. Грубо говоря, по гистограмме можно понять, какое направление градиента сильнее, а какое слабее в данной ячейке.

3. Затем обычно вектор нормализуется, то есть все его значения приводятся к значениям от 0 до 1
Но авторы пошли дальше, они для каждой ячейки 8 на 8 взяли еще информацию от соседних ячеек, определенным образом сложили, нормализовали и получился вектор размерностью 9х4.

Данный HOG дескриптор можно визуализировать (см видео) - на черном фоне в каждой ячейке 8х8 мы видим направления градиента в виде коротких полосок.
В итоге, для каждой ячейки формируется 4 гистограммы, в слайдинг-окно по горизонтали влезет 7 таких векторов, по вертикали 15 векторов и общая размерность вектора признаков для слайдинг-окна составляет: 15*7*9*4 = 3780

см подробнее gs-studio.com/news-about-it/31930-object-detection...
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы