Maxim_ka
@Maxim_ka
Системный инженер

А чем вы мониторите большое количество серверов?

Всем доброй ночи,



Давно мучает вопрос, чем осуществляют мониторинг большого количества серверов ( >50 ) специалисты с Хабра, прошу поделиться опытом.

У себя используем систему мониторинга WhatsUp и PRTG, самописные скрипты, SNMP и.т.д. все это несомненно удобно, но… упускается много других проблемных зон, связанных с проблемами по железу, например вылетевший блок питания, или же проблема с одним из винтов на HW Raid, это безусловно можно привязать на мониторинг по скриптам и.т.д. но это слишком коряво(в принципе так сейчас и работает), так как разные ОС, разные железки.

Как бы Вы все это централизовали?
  • Вопрос задан
  • 6731 просмотр
Пригласить эксперта
Ответы на вопрос 9
tocha4
@tocha4
Я остановился на zabbix. Достаточно удобный интерфейс, много триггеров встроенных, возможность создания своих, можно привязать почти к любому железу. Ну и бесплатно, что с таким функционалом подкупает.
Ответ написан
@rozhik
zabbix. Отлично мониторит http/s, snmp, время выполненния запросов к бд (или что угодно другое, на что скриптик фантазии написать хватит).
Клёво протоколирует. Хорошие алармы и отчеты.
Ответ написан
stavinsky
@stavinsky
Советую посмотреть на сборку nagios под названием CheckMK. Делают немцы, почти все переписали под себя уже. Отличный понятный интерфейс. Легко ставится. Имеет своего пассивного агента с предустановленными проверками по многим сервисам. Оптимизирован под highload. (все возможные nosql, cache и тд уже в комплекте и работают. )
Ответ написан
track
@track
Разве вылет блока питания не шлет ловимый prtg эвент?
Ответ написан
@joneleth
Zabbix, но для специфичных вещей скрипты все равно писать придется, бонус в том, что все в одном интерфейсе будет.
Ответ написан
the dude.
Правда мы в основном мониторим роутеры и свичи.
Ответ написан
Acidmind
@Acidmind
Мы Nagios используем. Скрипты просто писать. Я на ruby пишу под наши нужды. Мониторинг MS SQL, DB2, бэкапы… Пока не нашёл задачи которую нельзя было бы решить.
Ответ написан
CyberFlow
@CyberFlow
Для мониторинга количественных метрик использую ganglia. Для событийного мониторинга Shinken или Icinga, плюс прибавить к этому централизованную сборку логов в logstash + elasticsearch. Выглядит сложно, но для систем овер 50 машин с запросами мониторинга железа, сетевых узлов и т.п. простого варианта, по моему, быть не может.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы