Алгоритмы построения 3д моделей как раз основаны на том, что камера (точка, с которой делается фото) меняется, а сам объект — нет. Таким образом, растягивающиеся футболки как раз не подходят, они нарушают это допущение; обычно используется либо заранее известный маркер размера (например, как в этом мануале
https://docs.opencv.org/3.1.0/d5/dae/tutorial_aruc... либо какие-то ключевые точки находятся алгоритмически.
Настолько я знаю, простого и универсального решения этой задачи в такой постановке нет. В качестве начальной точки можете почитать про
https://en.wikipedia.org/wiki/Photogrammetry.