Потому что придется для каждого кадра сначала все объекты пихать в один буфер, а потом его отрисовывать, дороже будет. А так, каждый объект в своём буфере и рисуем, как хотим. Плюс, как вы на разные объекты разные шейдеры и текстуры включите, если они одним вызовом будут рисоваться?
Далее, если у вас 100 одинаковых объектов, придется делать буфер размером под 100 объектов, вместо того чтобы нарисовать из одного буфера 100 раз подряд.