Как найти линейное преобразование плоскости?

Question

Николай Чуприк @choupa

Архитектор (обычный, который строит)

Математика

Как найти линейное преобразование плоскости?

Есть два изображения плоского предмета (например книга). Найден набор нумерованных ключевых точек на обоих фото. Установлено их соответствие. Требуется найти линейное преобразование (масштаб, поворот, перспектива) от одного фото к другому.

Понятно, что для любых четвёрток точек можно составить систему линейных уравнений, и решив её, получить параметры преобразования плоскости.

Но дело в том, что такие четвёрки можно выбрать множеством способов, и решения систем будет немного различаться (в силу неточности координат распознанных ключевых точек). Т.е. есть избыточное количество конкурирующих систем линейных уравнений.

Не могу придумать как быстро получить параметры наилучшего преобразования. Перебор всех вариантов формирования четвёрток — не реален, да и понятно, что это в целом плохой путь. А как быть?

Критерий наилучшести — минимум суммы среднеквадратичных отклонений образов всех точек первого фото от фактических точек второго фото.

Вопрос задан более трёх лет назад
183 просмотра

4 комментария

Подписаться 3 Сложный 4 комментария

xmoonlight @xmoonlight

А визуально - можете пример привести? (было бы проще обсуждать)
Ещё вопрос: предметы - одинаковые (т.е., экземпляр) или подобные (т.е., книга "A" и книга "Б")?
Оси вращения и оси симметрии - нужно искать первым делом на основе топологии объекта по контрольным точкам.

Написано более трёх лет назад
Николай Чуприк @choupa Автор вопроса

Один и тот же предмет. Установлен большой набор парных ключевых точек. Предмет произвольно повёрнут в пространстве и масштабирован. Упрощающий момент: поверхность предмета плоская.

Написано более трёх лет назад
xmoonlight @xmoonlight

Николай Чуприк, Вот здесь всё, касательно ответа на вопрос.

Написано более трёх лет назад
Николай Чуприк @choupa Автор вопроса

xmoonlight, спасибо то, что надо. Сделайте, если не затруднит, ответ.

Написано более трёх лет назад

Помогут разобраться в теме Все курсы

Skillbox

Математика для Data Science

4 месяца

Далее
Яндекс Практикум

Математика для анализа данных

6 месяцев

Далее
Skillfactory

Математика для Data Science

8 недель

Далее

Решения вопроса 1

Комментировать

Пригласить эксперта

Ответы на вопрос 2

2 комментария

5 комментариев

Николай Чуприк @choupa Автор вопроса

1. B — вообще-то матрица.

2. Каким образом и по каким таким параметрам вы предлагаете брать производные в А и В? Это же не аналитические функции, а просто набор чисел.

Написано более трёх лет назад
Karpion @Karpion

У нас есть функция "суммарное квадратичное отклонение". И мы берём частные производные от этой функции по A и по B.

То, что A является вектором, а B является матрицей - нас не пугает. Мы просто получаем больше переменных: A1, A2, B11, B12, B21, B22.
В начальный момент решения задачи - это не числа, а переменные, значение которых мы ищем. Т.е. это параметры функции "суммарное квадратичное отклонение" - и мы ищем частные производные этой функции по каждому из шести параметров.
Слово "частная производная" означает, что когда я беру производную по одному из параметров - остальные "замирают" и считаются константами. В Википедии это д.б. написано.

Написано более трёх лет назад
Николай Чуприк @choupa Автор вопроса

Karpion, спасибо за советы. В принципе по такой схеме у надо действовать. Пояснять тонкости сложно, но нам надо оставаться в определённом классе преобразование движения пространства, а не вообще всех любых линейных преобразований. Может так статься, что простой минимум отклонений (почти наверняка) окажется за пределами нужного класса (группы) преобразование. Поэтому надо брать в качестве параметров не просто В11, В11, а какие-то "правильно" параметризованные компоненты матрицы (например через углы поворотов), чтобы преобразование оставалось в группе.

Написано более трёх лет назад
Karpion @Karpion

Ну, Вы бы для начала расписали полный список возможных преобразований. Никто не любит внезапной смены условий задачи.

Есть такой метод решения:
Сначала мы хоть как-то (можно криво) линеаризуем задачу. Линейные уравнения решаются легко.
Допустим, возможные преобразования - это сдвиг, масштаб и поворот: итого четыре параметра. Но мы решим это по вышеприведённой схеме и получим шесть параметров.
После этого мы считаем. что сдвиг посчитан верно, а из матрицы B как-то вычисляем масштаб и поворот (как - я пока не придумал; если будет актуально, подумаю ещё). Полученные {сдвиг, масштаб и поворот} мы можем использовать как отправную точку для дальнейших поисков - например, симплекс-методом.

Короче говоря - огласите исходную задачу.

Написано более трёх лет назад
Николай Чуприк @choupa Автор вопроса

Karpion, в итоге пошёл к OpenCV. Там есть решение.

Написано более трёх лет назад

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Математика

Простой
Правильное ли док-во существования функции?
- 1 подписчик
- 10 нояб.
- 174 просмотра
1

ответ
Математика

Простой
Почему не используется простая таблица истинности?
- 1 подписчик
- 07 нояб.
- 143 просмотра
1

ответ
Математика

Простой
Как решается такое задание?
- 1 подписчик
- 02 нояб.
- 204 просмотра
2

ответа
Математика

Простой
Нужно ли это доказывать в обратную сторону?
- 1 подписчик
- 17 окт.
- 176 просмотров
1

ответ
Математика

+1 ещё

Простой
Хороший учебник/статья/книга по производным и началам матанализа?
- 2 подписчика
- 08 окт.
- 315 просмотров
2

ответа
Математика

Средний
Какая функция y=f(x) может описывать подобный график с ассиметричным распределением?
- 1 подписчик
- 01 сент.
- 491 просмотр
2

ответа
Математика

+3 ещё

Средний
Как выбрать размеры интервалов для неравно интервального вариационного ряда?
- 1 подписчик
- 24 июн.
- 185 просмотров
2

ответа
Математика

+1 ещё

Средний
Как найти площадь большого сегмента?
- 1 подписчик
- 12 июн.
- 232 просмотра
1

ответ
Математика

Средний
Как правильно заниматься перебором: a³ + b³ + c³ = d³?
- 1 подписчик
- 22 мая
- 520 просмотров
1

ответ
Математика

+1 ещё

Простой
Имеется ли для комбинаторного задания однозначная интерпретация?
- 1 подписчик
- 12 мая
- 168 просмотров
1

ответ
Показать ещё Загружается…

Разработчик PHP (junior / стажер) - Laravel

CRM для НКО Мост данных

от 30 000 до 110 000 ₽

Стажер Аналитик

ПСБ цифровая лаборатория • Москва

от 30 000 до 60 000 ₽

Deep Learning Engineer (GigaChat Prod)

Сбер • Москва

от 350 000 ₽

А визуально - можете пример привести? (было бы проще обсуждать)
Ещё вопрос: предметы - одинаковые (т.е., экземпляр) или подобные (т.е., книга "A" и книга "Б")?
Оси вращения и оси симметрии - нужно искать первым делом на основе топологии объекта по контрольным точкам.
Один и тот же предмет. Установлен большой набор парных ключевых точек. Предмет произвольно повёрнут в пространстве и масштабирован. Упрощающий момент: поверхность предмета плоская.
Николай Чуприк, Вот здесь всё, касательно ответа на вопрос.
xmoonlight, спасибо то, что надо. Сделайте, если не затруднит, ответ.

Answer 1 · 2018-11-30 21:53:49

xmoonlight @xmoonlight

https://sitecoder.blogspot.com

Вот здесь всё, касательно ответа на вопрос.

Ответ написан более трёх лет назад

Комментировать

Answer 2 · 2018-11-29 18:25:53

По любой четвёрке находим ориентировочное решение. Далее, задав точность, применяем найденное решение с поправкой на +-delta. Находим наиболее оптимальное дельта по указанному критерию.

Поясню:
1) нашли афинное преобразование: +10 - сдвиг всех точек на 10 вправо
2) задаём точность: 0,01
3) в цикле оцениваем ваш критерий для всех сдвигов вправо от 5 до 15 с шагом 0,01
4) выбираем лучший сдвиг

Answer 3 · 2018-12-03 18:41:38

У Вас в задаче заложен ответ!

Пусть координаты точек первой картинки = P[i], второй = V[i] (каждая координата = вектор с двумя значениями).

Далее надо записать линейное преобразование:
P[i] -> A + B*P[i]
(A и B тоже имеют по две компоненты; A = вообще нормальный обычный вектор).

Ищем разницу, возводим в квадрат:
(A + B*P[i] - V[i])^2
суммируем это по i (по всем точкам).

Теперь берём четыре частные производные по каждой компоненте A и B, приравниваем их к нулю. Получаем четыре линейных уравнения.
Ну а решать линейные уравнения - должен уметь всякий.

Upd1: Что такое "перспектива" - я не понял. Наклон фотоаппарата, что ли?
Если B - это одна компонента, то алгоритм остаётся прежний.

Upd2: Если надо учитывать ещё и возможность поворота на определённый угол - будет сложнее; но преобразование всё равно линейное.

Как найти линейное преобразование плоскости?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт