@shell_guy

Как править конфиг Prometheus для отправки алерта когда нода более 2-х минут в down?

Доброго времени суток!
Подскажите пожлауйста как решить след. проблему: прометей шлет алерты даже если краткострочные потери сигнала на свитче к примеру и спамит в слак.
Как сделать так чтобы отправлялся 1 алерт в случае если нода лежит более 2-х минут подряд? Какой правило нужно добавить и в какой конфиг? Спасибо большое
  • Вопрос задан
  • 80 просмотров
Решения вопроса 1
karabanov
@karabanov
Системный администратор
Исправь правило, в for напиши 2m примерно так:
- alert: Node down
    expr: up{job="node_exporter"} == 0
    for: 2m
    labels:
      severity: warning
    annotations:
      title: Node {{ $labels.instance }} is down
      description: Failed to scrape {{ $labels.job }} on {{ $labels.instance }} for more than 3 minutes. Node seems down.
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы