Нужно определиться, зачем разбивать на вланы. Обычно это делают для возможности контроля (и ограничения) трафика между разными логическими частями инфраструктуры. В таком случае, конечно - нужно, чтобы данные, не предназначенные для "своего" влана проходили через какое-то L3-устройство, а следовательно - должен быть нелокальный маршрут.
В вашем случае - да, разбивать на более мелкие диапазоны.