Это не важно. Вы просто найдите то самое узкое место.
И тогда у вас ускорится и в моменты высоких нагрузок и в моменты низких нагрузок.
Это слишком синтетический тест.
Ну вот я сейчас напрягу мозги, подключатся коллеги - и мы вам объясним что и где в вашем синтетическом тесте приводит к таким последствиям.
Но это не решит вашу корневую проблему.
Реальные тесты - будут небом и землей по сравнения с синтетическими.
Достаточно подождать несколько минут, чтобы собрать результаты по десяткам и сотням запросов.
Без спуска на уровень прикладной задачи вряд ли у вас что получится тут узнать.
Это могут быть тупо блокировки.
Да и кто вам сказал, что ваша подсистема спроектирована работать действительно параллельно?
Зачем разбивать класс на файлы?
Если клас очень большой или методы большие - нужно думать над кодом, а не делить на файлы.
Он не в том, что измерять. А в том, как.
Я измеряю очень много точек в приложениях. Но вопрос не об этом.