Как организовать нейросеть для решения задачи локализации объектов?
Здравствуйте, участники проекта Toster.
Могли бы Вы помочь разъяснить некоторые детали?
Суть вопроса/проблемы заключена в заголовке.
Правильный ли подход используется:
В сверточную нейронную сеть подаётся изображение, существует несколько слоев, через которые проходят входные данные.
На выходе n нейронов, каждый из которых отвечает за определенную область изображения.
Таким образом хотелось бы получить маску, которая содержит m из n областей, от которых "сигнал" был наиболее силен (выше порога).
Входные данные: изображения и маски, с которыми сравнивается выход нейросети.
Так, по задумке, в сравнении маски и выхода ищем функцию ошибки.
Правильный ли подход выбран?
Если нет, тогда какую конфигурацию и подход Вы бы посоветовали?
Или же только лишь с помощью CNN эту задачу решить нельзя?
MMostovenko: самый последний слой состоит из n нейронов (n, допустим, равно 200), каждый из которых отвечает за прямоугольную область на изображении. "Сигнал", условно, выше, чем 0.8, красим область (т.е. там по предположению что-то есть, нам нужное). И так для всех n областей по каждому нейрону.