Можно ли с нуля написать CNN для детекции объектов?
т.е. без внедрения готовых обученных моделей. Например, нужно на фото распознать несколько типов отходов: металл, бумага и т.д. Или же взять готовую архитектуру и самому обучить? насколько трудно будет это реализовать, если делать на python с keras? Мне нужно, чтобы распознавало только типы отходов, ничего больше, кроме них.
Был бы рад, если б показали архитектуру такой сети
Нет конечно, нельзя и невозможно! Ведь у других людей инструменты недоступные Вам! И они точно-точно не пользуются такими же средствами, которые доступны Вам.
я читал, что есть R-CNN, faster R-CNN. Если я вместо добавления готовой модели (например VGG16) в новую архитектуру model.add(VGG16()), просто добавлю всю его архитектуру таким образом
.....
model.add(layer)
model.add(layer)
.....
и т.д. и импортирую веса, будет ли корректно работать или что-то дополнительно потребуется сделать?
и второй вопрос: чтобы обучить сеть детектировать сразу несколько объектов на одном фото, достаточно ли, чтобы датасет состоял из картинок с одним объектом или же должен быть с несколькими объектами на одной картинке?