Как правильно настроить авто-масштабирование веб-приложения в Kubernetes что бы избежать overprovisioning?

Question

splatt @splatt

Kubernetes

Как правильно настроить авто-масштабирование веб-приложения в Kubernetes что бы избежать overprovisioning?

Допустим есть традиционное веб-приложение, построенное на микросервисах. Без какой-либо серьезной нагрузки, приложение потребляет минимальное количество ресурсов. Под нагрузкой, использование CPU растет линейно с количеством пользователей/запросов в секунду.

Если выставить значение resources.requests.cpu в низкое значение, например 5%, то без нагрузки все работает хорошо: мы можем запустить несколько микросервисов на одной ноде, итд. Но при увеличении нагрузки, HorizontalPodAutoscaler поптается увеличить количество инстансов (подов на микросервис) и из-за низкого значения requests они запускаются на одной и той же ноде, даже если общая нагрузка ноды более 90%. Это приводит к тому что нагрузка CPU ноды начинает превышать 95% и нода и приложения становятся нестабильными.

Если выставить значение resources.requests.cpu в более высокое, например 21%, то данной проблемы нет. При превышении нагрузки 84%+ HPA попытается добавить поды, а в ответ Cluster Auto Scaler добавляет новые ноды. Но мы по сути мы таким образом ограничиваем ноду максимум 4мя подами. При увеличении количества микросервисов эта проблема становится актуальнее и получается что мы делаем дикий overprovisioning и переплачиваем за ресурсы во много раз.

Что я упускаю? В более традиционных решениях, таких как ECS, такой проблемы не существует так как автомасштабирование подов и нод раздельно, и можно задать порог например 70% для ноды после которого в Auto Scaling Group создаются больше инстансов.

Можно задать Negative Pod Affinity и запретить запускать больше 1го пода одинакового типа на 1й ноде, но это выглядит как хак и приводит к тому, что для blue-green деплойментов требуется в два раза больше нод, даже если нагрузка минимальна.

Как правильно подходить к авто-масштабированию веб-приложений с помощью HorizontalPodAutoscaler и ClusterAutoScaler?

Вопрос задан более двух лет назад
148 просмотров

6 комментариев

Подписаться 3 Средний 6 комментариев

Saboteur @saboteur_kiev

https://kubernetes.io/docs/concepts/scheduling-evi...

Написано более двух лет назад
splatt @splatt Автор вопроса

Saboteur, не очень понял, каким образом это помогает решить описанную проблему...

Написано более двух лет назад
Saboteur @saboteur_kiev

splatt, там же есть про то, как настраивать, чтобы поды распределялись по имеющися нодам. пробовать, экспериментировать.

Написано более двух лет назад
ZIK1337 @ZIK1337

есть еще VPA, не пробовали?

Написано более двух лет назад
Zerg89 @Zerg89
type: Resource resource: name: cpu target: type: Utilization averageUtilization: 60

With this metric the HPA controller will keep the average utilization of the pods in the scaling target at 60%. Utilization is the ratio between the current usage of resource to the requested resources of the pod. See Algorithm for more details about how the utilization is calculated and averaged.
Написано более двух лет назад
Zerg89 @Zerg89
splatt,
Хотя в вашем случае такое ограничение нужно

type: ContainerResource containerResource: name: cpu container: application target: type: Utilization averageUtilization: 60
Написано более двух лет назад

Помогут разобраться в теме Все курсы

Яндекс Практикум

Инженер облачных сервисов

2 месяца

Далее
Яндекс Практикум

DevOps для эксплуатации и разработки

7 месяцев

Далее
Яндекс Практикум

Архитектура программного обеспечения

6 месяцев

Далее

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Цифровые сертификаты

+1 ещё

Средний
Почему не получается выдать сертификаты cert manager?
- 1 подписчик
- 5 часов назад
- 24 просмотра
0

ответов
Linux

+1 ещё

Средний
Minikube/Kubernetes: как устранить ошибку при установке ingress аддона (webhook)?
- 3 подписчика
- 27 окт.
- 136 просмотров
0

ответов
Kubernetes

Средний
Мастер нода выпала из подсети?
- 2 подписчика
- 02 сент.
- 432 просмотра
1

ответ
Amazon Web Services

+1 ещё

Простой
Где NATятся адреса в кубернетесе?
- 1 подписчик
- 19 июн.
- 215 просмотров
2

ответа
Kubernetes

Средний
Как можно настроить видимость только доступных ns в k8s?
- 2 подписчика
- 02 июн.
- 481 просмотр
0

ответов
Kubernetes

Средний
Проблема с установкой Metrics-server. Как его правильно установить?
- 1 подписчик
- 28 мая
- 91 просмотр
0

ответов
Linux

+2 ещё

Простой
Почему миграция с AWX 17 на AWX Operator не работает?
- 1 подписчик
- 26 февр.
- 151 просмотр
3

ответа
Kubernetes

+1 ещё

Простой
Как отправлять текстовые данные в логстеш?
- 1 подписчик
- 17 февр.
- 98 просмотров
1

ответ
Kubernetes

+1 ещё

Простой
Бесконечный yandex_kubernetes_node_group.kubernetes_node_group: Still creating. Что делать?
- 1 подписчик
- 16 февр.
- 110 просмотров
1

ответ
Linux

+2 ещё

Средний
Почему останавливается разворачивание ROOK в MINIKUBE?
- 1 подписчик
- 13 февр.
- 127 просмотров
1

ответ
Показать ещё Загружается…

Java разработчик

SENSE

До 450 000 ₽

Java Developer (Клик)

Сбер • Москва

от 400 000 ₽

Linux Systems Engineer (Asterisk/SIP)

IT ATLAS • Москва

от 200 000 ₽

Saboteur, не очень понял, каким образом это помогает решить описанную проблему...
splatt, там же есть про то, как настраивать, чтобы поды распределялись по имеющися нодам. пробовать, экспериментировать.
type: Resource resource: name: cpu target: type: Utilization averageUtilization: 60

With this metric the HPA controller will keep the average utilization of the pods in the scaling target at 60%. Utilization is the ratio between the current usage of resource to the requested resources of the pod. See Algorithm for more details about how the utilization is calculated and averaged.
splatt,
Хотя в вашем случае такое ограничение нужно

type: ContainerResource containerResource: name: cpu container: application target: type: Utilization averageUtilization: 60

Как правильно настроить авто-масштабирование веб-приложения в Kubernetes что бы избежать overprovisioning?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт