Вам нужно объединить keyframes и 3d transformations. Потребуется 5 кадров.
Ваш первый и последний кадры будут без трансформации, 2 и 4 должны обеспечивать сужение/расширение, а 3 будет сжатием.
В принципе вам нужна перспектива и трансляция. Остальное как
Alevs сказал.