Вот само по себе "сравнение производительности" не совсем корректная постановка вопроса,т.к. в некоторых тестах там не самые производительные языки на первом месте, поэтому нужно уточнить контекст сравнения, в какой области, допустимо ли использование стандартных общих функций и т.д.
По нормальному нужно проверять, что код оптимизирован под определенный язык, если вы напишите похожий на разных языках, не факт, что он будет одинаково оптимизирован. Вот в нескольких тестах я нашел прямой вывод в консоль во время выполнения теста, хоть я не занимаюсь обычно написанием тестов производительности, но такие вещи в тестах это плохо, т.к. фукции вывода в консоль сильно по разному реализованы в каждом языке(//go fmt.Println(prime) //c# Console.WriteLine(prime)). И обычно они разной степени тяжести.
UPD: в общем я хотел сказать, что в одном языке могут лучше оптимизированы одни функции лучше других, и если вы пишете приложение с использованием определенных стандартных функций, то практически есть смысл сравнивать только эти функции/модули в языках