@svakhovksyy

Есть ли толковая замена monit?

В компании используется система мониторинга monit.
Сам по себе - он говно лютейшее. Но у него есть агент, который позволяет ребутать сервис, который подвис.
Стоит вопрос перейти на другую систему мониторинга. Но хотелось бы оставить возможность автоматически ребутать сервис.
Есть ли такое на рынке?
Я пока что ничего такого не нашел.
  • Вопрос задан
  • 121 просмотр
Решения вопроса 1
@zohan1993
devops
была подобная задача
нужно было делать определенные действия на хостинге и на хостах
так как весь мониторинг был построен вокруг Prometheus + Grafana + Alertmanager + куча експортеров, было желание прикрутить все в эту схему
решение которое покрыло все задачи
https://github.com/adnanh/webhook/

если коротко, есть alert rule c определенным label, когда правило сработало, alert manager через routes отправляет сообщение (POST) на receiver - webhook endpoint, чем и запускает execute-command которая настроена для этого webhook endpoint, а дальше как фантазия и возможности позволяют, у меня была работа по API c хостингом, запуск джобов через API на Ansible Tower, просто запуск команд через SSH
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
@unseriously
Для мониторинга - prometheus. Возможности бутать сервис у него нет. Но это можно прикрутить с помощью всяких костылей, типа такого: https://github.com/imgix/prometheus-am-executor
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы