Существуют ли нейросети для воксельных 3D-объектов?
Я видел, как люди используют нейронные сети или похожие алгоритмы для распознавания признаков на 2D-изображениях или классификации объектов, изображённых на них. Например, для распознавания человеческих лиц или определения вида животного на фотографии. Но как насчет распознавания признаков для 3D-объектов? Теоретически я мог бы перевести 3D-модель из mesh-формата в вокселизированный формат и использовать почти те же алгоритмы для распознавания признаков, чтобы определить, какие воксели составляют руки, голову, глаза и т. д.
Существуют ли уже какие-либо модели для такого рода задач? С какими трудностями я столкнусь, если захочу построить что-то подобное? Помимо составления дата-сета, конечно
Могу скачать такое точно есть, когда я диплом защищал была такая презентация. Там типо скачало создавался альфа потом воксельная модель потом похожий мэш ну и при каждом шаге отсеивались не подходящие модели. Я попробуй одногруппнику написать что б скинул но не обещаю что получится.
А так кстати вроде в zbrush вроде есть плагин для вокселизации мэша
Да, буду благодарен. Не знаю, есть ли тут диалоги, но отправь короче на maximgradan@gmail.com. Почитать будет интересно, даже если это в действительности совсем не то, что нужно. Но вообще, именно с вокселизацией меша проблем никаких быть не должно точно, я уверен, такое и в Blender'e сделать можно, пускай даже сторонними средствами. Что мне интересно, так это увидеть нейронку, которая на вокселизированных моделях обнаруживает, какие воксели к какой конечности относятся. Точно так же как сейчас можно находить на изображениях лица людей
Давным давно, когда еще не было такого огульного использования нейросетей, как сегодня,
я читал про преобразование Радона. Оно позволяет по одной проекции восстановить
больше измерений наблюдаемого объекта. Например как в томографе.
Но для того чтоб восстановление было точным - надо много раз поворачивать камеру и снимать
наблюдаемый объект с разных углов.
В класическом варианте Радон описан как одномерная функция y=f(x) но для твоего варианта
надо просто дать больше измерений на вход (фоток). И камеру крутить тебе надо не
по кругу как в томографе а со всех всевозможных углов по Эйлеру. На выходе будут вещественные
вокселы. (они будут все завсечены но с разной интенсивностью). Какие-то сильнее и какие-то слабее.
И если прогнать их через трешолд то получится вполне себе точная 3Д модель.