Кластер и не должен уменьшать время загрузки. Его задача - поднять общую производительность rps (request per second). Как он работает, соединение устанавливается с мастером и потом сокет передается через IPC в воркер для обработки. Если каждое соединение делает нечто более трудоемкое, чем отдача строки, то это позволит утилизировать под задачу доп. ядра, но для Вашего случая, накладные расходы на IPC компенсируют распараллеливание обработки. Кроме того, IPC сам по себе не быстрый, и cluster - это кусок говнокода, из встроенных библиотек ноды хуже написана только http. Я убрал cluster из своих проектов и готовлюсь убрать http.