А чем вы мониторите большое количество серверов?

Question

Максим @Maxim_ka

Системный инженер

А чем вы мониторите большое количество серверов?

Всем доброй ночи,

Давно мучает вопрос, чем осуществляют мониторинг большого количества серверов ( >50 ) специалисты с Хабра, прошу поделиться опытом.

У себя используем систему мониторинга WhatsUp и PRTG, самописные скрипты, SNMP и.т.д. все это несомненно удобно, но… упускается много других проблемных зон, связанных с проблемами по железу, например вылетевший блок питания, или же проблема с одним из винтов на HW Raid, это безусловно можно привязать на мониторинг по скриптам и.т.д. но это слишком коряво(в принципе так сейчас и работает), так как разные ОС, разные железки.

Как бы Вы все это централизовали?

Вопрос задан более трёх лет назад
6855 просмотров

1 комментарий

Подписаться 14 Оценить 1 комментарий

Помогут разобраться в теме Все курсы

Нетология

Системный администратор

11 месяцев

Далее
Академия Эдюсон

DevOps-инженер + ИИ

7 месяцев

Далее
Skillbox

Системный администратор с нуля

6 месяцев

Далее

Пригласить эксперта

Ответы на вопрос 9

1 комментарий

Комментировать

1 комментарий

Комментировать

1 комментарий

Комментировать

1 комментарий

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Компьютерные сети

+3 ещё

Средний
Почему с домашнего интернета не проходит исходящий UDP до моего VPS?
- 1 подписчик
- 19 июл.
- 276 просмотров
4

ответа
Windows

+1 ещё

Простой
Как в windows повесить две службы на один порт? Или как заменить порт в зависимости от источника?
- 3 подписчика
- 08 июл.
- 682 просмотра
4

ответа
Windows

+2 ещё

Простой
Почему отваливается принтер по USB?
- 3 подписчика
- 10 июн.
- 752 просмотра
3

ответа
Мониторинг

+1 ещё

Средний
Какие датчики трека позиционирования можно применить в эксперименте с применением масштабной модели шахты?
- 2 подписчика
- 29 мая
- 140 просмотров
2

ответа
Системное администрирование

Средний
Прыгает пинг в играх при идеальных показателях до DNS Google (0% потерь, джиттер 2мс) Что делать?
- 1 подписчик
- 22 мая
- 366 просмотров
3

ответа
Системное администрирование

+1 ещё

Простой
Как запретить внешние HDD в каспере?
- 5 подписчиков
- 15 мая
- 804 просмотра
1

ответ
Windows

+2 ещё

Средний
Как восстановить настройки по умолчанию брэндмауэра Windows 7?
- 1 подписчик
- 13 мая
- 336 просмотров
1

ответ
Системное администрирование

+1 ещё

Средний
Youtube через smart TV в 2026году?
- 1 подписчик
- 10 мая
- 607 просмотров
3

ответа
Системное администрирование

+1 ещё

Простой
Что может значит «Количество SIP линий» в облачной АТС в настройках SIP-аккаунта (фото прилагается)?
- 2 подписчика
- 29 апр.
- 284 просмотра
2

ответа
Системное администрирование

+2 ещё

Средний
Как дать дефолтному пользователю 1С 8.3 право на загрузку XML?
- 3 подписчика
- 27 апр.
- 342 просмотра
1

ответ
Показать ещё Загружается…

Пока побеждает Zabbix, на самом деле я тоже большой сторонник использования его для мониторинга.
Но тут пришлось использовать то что было.
Значит буду пробовать настроить iLo и другие типы SP на него. Для мониторинга исключительно хардверных компонентов.

Answer 1 · 2013-08-10 23:49:30

Я остановился на zabbix. Достаточно удобный интерфейс, много триггеров встроенных, возможность создания своих, можно привязать почти к любому железу. Ну и бесплатно, что с таким функционалом подкупает.

Answer 2 · 2013-08-11 01:58:52

zabbix. Отлично мониторит http/s, snmp, время выполненния запросов к бд (или что угодно другое, на что скриптик фантазии написать хватит).
Клёво протоколирует. Хорошие алармы и отчеты.

Answer 3 · 2013-08-11 14:52:05

Советую посмотреть на сборку nagios под названием CheckMK. Делают немцы, почти все переписали под себя уже. Отличный понятный интерфейс. Легко ставится. Имеет своего пассивного агента с предустановленными проверками по многим сервисам. Оптимизирован под highload. (все возможные nosql, cache и тд уже в комплекте и работают. )

Answer 4 · 2013-08-11 03:28:04

ergil @ergil

Поддержу двух предыдущих ораторов. Zabbix.

Ответ написан более трёх лет назад

Комментировать

Answer 5 · 2013-08-11 05:16:14

track @track

Разве вылет блока питания не шлет ловимый prtg эвент?

Ответ написан более трёх лет назад

1 комментарий

Answer 6 · 2013-08-11 10:04:03

Zabbix, но для специфичных вещей скрипты все равно писать придется, бонус в том, что все в одном интерфейсе будет.

Answer 7 · 2013-08-11 13:34:04

Владимир @merdoc

the dude.
Правда мы в основном мониторим роутеры и свичи.

Ответ написан более трёх лет назад

1 комментарий

Answer 8 · 2013-08-13 15:28:01

Мы Nagios используем. Скрипты просто писать. Я на ruby пишу под наши нужды. Мониторинг MS SQL, DB2, бэкапы… Пока не нашёл задачи которую нельзя было бы решить.

Answer 9 · 2013-08-16 14:59:26

Для мониторинга количественных метрик использую ganglia. Для событийного мониторинга Shinken или Icinga, плюс прибавить к этому централизованную сборку логов в logstash + elasticsearch. Выглядит сложно, но для систем овер 50 машин с запросами мониторинга железа, сетевых узлов и т.п. простого варианта, по моему, быть не может.

А чем вы мониторите большое количество серверов?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт