Можно, но увы задачу не решает.
Идея в том, что мы не занимаемся сжатием на лету.
99% запросов приходят с Accept-Encoding: gzip, поэтому выгоднее взять сразу сжатое из кэша и отдать, чем взять из кэша несжатое, сжать и отдать.
Армянское Радио, на основе анализа запросов в access_log, их кол-ва, требуемого rps в proxy 500 rps / режиме кэша ( 2500 rps ), среднего размера ответа API ( 12 Kb JSON )
В целом не встречал, чтобы кто-то переживал на счёт сжатия. Можно снизить коэффициент сжатия, скажем до 3 и не сжимать ответы меньше килобайта или заменить gzip на brotli если хочется попробовать что-то оптимизировать.
А вообще есть BSON и ProtoBuf если хочется кардинальной оптимизации - тут сжатие вовсе будет ненужно (как говориться зачем оптимизировать то, от чего можно отказаться).
Александр Карабанов, да я собственно из-за него тоже бы не переживал, но в текущей ситуации CPU становятся ресурсом, а если учесть, что такой кэш не один это начинает уже стоить денег.
Что касается BSON - тут бабушка надвое сказала.
Protobuf был бы вариантом, но на него нет человекочасов :(