Здесь, вопрос про целесообразность, оплачивания gpu сервера, если у тебя нет gpu-bound операций.
Докер, ставишь, ngnix также при чем в докер, а не в систему. Современные ml архитектуры подразумевают, развертывания, как бэкенда так и фронта (mlflow, airflow и т.д.) все имеют веб интерфейсы, которые сильно облегчают жизнь.