Посидел немного подумал, и вот к какому ответу пришел. Надеюсь это кому то поможет!
Вот сам ответ:
zoompan=zoom=2:x=100:y=250:d=1,setdar=dar=9/16
фильтр используется zoompan
далее zoom = насколько единиц приближаем по ози Z
x = 100 - отодвигается по ози X
y = 250 - отодвигается логично по ози Y
d=1 - не особо понял, в чем соль этого флага, но с ним видео корректно конвертируется, и нет просадки кадров, поэтому она как обязательная, как я полагаю, без неё у меня не сработало
setdar=dar=9/16 - Параметр для того чтобы сохранялось вертикальное видео, а не горизонтальное , без этого параметра по дефолту конвертит в 16/9