Для начала, что ты хочешь сделать? Локализацию на изображении нескольких объектов из нескольких категорий?Да именно это.
то лучше обучать сеть с прицелом на пиксельные карты.Этот вариант выглядит лучше, единственная проблема, что я нигде не могу найти хоть какой то пример как его сделать. Не подскажешь материалы для изучения, если не сложно?