Как построить нейронную сеть для обнаружения объекта на фото?
Я хочу обучить модель, используя датасет COCO 2017. Смысл в том, что на всех фото там несколько объектов, и вот, как должна выглядеть архитектура нейронной сети, чтобы правильно предсказать?