заниматься придется - Эластик память жрет что тот лев
обычно 2-3, 2, по-моему, прямо в мануале написано, 3 тоже где-то рядом
а дальше - от числа RPS клиентов зависит
+ если гнаться за временем ответа (ну типа не больше 1мс) ради СЕО, возникает ситуация, когда склейка с кучи шардов тоже занимает время, и это обуславливает цифу шардов в кластере , например, не более 20
(хз что у вас за документы, думаю, в вашем случае потолок будет ниже)
ну и все, дальше уже распределение клиентов идет по кластерам