Про пыху не смогу расскзаать - работаю с нодой последние года
Серваки работают не в докере/кубах, а с помощью пм2 - у них есть неплохие кастомные метрики
Часть метрик собираю сам - программно - в приложении есть несколько очередей и нужно следить за джобами поименно.
Я собираю данные в редис (кол-во выполнений именной джобы в очереди, минимальная скорость выполнения за период и сколько джоб похожих было выполнено) и раз в 5 минут выгружаю в бд. В дешборде в админке вывожу графики с различными фильтрами.
В итоге просто комбинирую пм2 и кастомные метрики.