Вообще, производительность меряется пакетами в секунду. Вот,
посмотрите пример (Performance test results). NAT — достаточно затратная операция, скажем, Celeron 2.6 GHz на 478 сокете с оперативкой 266 мгц мог спокойно пропускать и одновременно анализировать (определять тип пакета, протокол, и записывать это все в базу) 200 МБит/с трафик с загрузкой где-то в 50%.
Да и аппаратный нат это далеко не всегда хорошо. Например, вот, хотите вы сделать так называемый NAT Loopback через iptables, и с включенным аппаратным натом вам этого нормально не сделать, т.к. нат биндится раньше, чем может выполнится loopback.