При адекватной настройке в режиме проксирования:
Nginx принимает соединение, потом лезет в кэш, если может отвечает из кэша. Если данных нет/протухли, то лезет по proxy_pass на ваш сервис, максимально быстро забирает данные и закрывает соединение с вами. Далее отдает данные клиенту с нужной скоростью.
Главный смысл в том что медленные клиенты висят на Nginx, минимально потребляя ресурсы сервера