Более простым языком, как построить SIFT дескриптор?

На основе этой статьи: https://habrahabr.ru/post/106302/
Первые пункты понятны и просты
1) Гауссом проходим по изображению несколько раз. Сохраняем некоторые стадии размытия
2) Вычитаем "соседние" полученные изображения
3) Исследуем каждый пиксель на экстремум вместе с окружающими его точками самого изображения, а также изображений "выше" и "ниже"
Все это делаем для нескольких "октав", т.е. исходное изображение уменьшается вдвое и т.д.
И вот тут я перестаю понимать. Что значит "аппроксимирование функции DoG многочленом Тейлора второго порядка", в смысле, что именно делать с изображением в плане реализации, к примеру, на С#? Не понимаю нахождение производных в пикселях. Ну и остальные дальнейшие шаги

Заранее спасибо
  • Вопрос задан
  • 371 просмотр
Пригласить эксперта
Ответы на вопрос 1
dmitry_pavlov
@dmitry_pavlov
World-class .NET freelance contractor (remotely)
Придется сначала разобраться в сопутствующей математике. Насколько я понял, задача сводится к написанию кода логики для определения, является ли точка в октаве ключевой, чтобы можно было найти ключевую точку октавы.

Либо можете попробовать разобраться в имеющемся коде - см. тут и тут.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы