Из обсуждения
https://github.com/golang/go/issues/50182 видно что проблема с производительностью generics не новая.
При запуске бенчмарков с флагами получается ожидаемое мной ± равное время выполнения ф-ций:
go test -bench=. -count=2 -gcflags=all=-d=unified
BenchmarkNativeFunc-4 2029149 600.5 ns/op
BenchmarkNativeFunc-4 2018277 591.7 ns/op
BenchmarkNativeMethod-4 1962086 592.0 ns/op
BenchmarkNativeMethod-4 2024234 603.9 ns/op
BenchmarkGenericFunc-4 1985313 573.4 ns/op
BenchmarkGenericFunc-4 2053454 585.1 ns/op
BenchmarkGenericMethod-4 2067790 591.3 ns/op
BenchmarkGenericMethod-4 2054346 612.2 ns/op
что
форсирует применение при компиляции
stenciling (трафарет по отдельным типам) вместо
словарного подхода реализации дженериков (текущая реализация).
Остаётся ждать оптимизаций в обновлениях языка