laduwka
@laduwka
Unix администратор

Какой выбрать инструмент для мониторинга?

Долго использовала для мониторинга серверов nagios и munin.
Nagios как система для алертов вполне устраивает: легко писать плагины, легко конфигурировать, есть много готовых плагинов.
Но munin это просто кошмар. Ужасные графики, невозможно масштабировать, делать выборки, неудобно сопоставлять информацию.
Плюс ко всему, я получаю две разные системы мониторинга с разными данными, снимаемыми разными плагинами.
В идеале, хотелось бы систему, которая умела строить графики, которые можно масштабировать и чтобы она умела отсылать алерты, имела базу плагинов. Серверов пока не много, около 10, но планируется рост.
Мониторить нужно системную информацию, raid контроллеры, диски (особенно raid и диски) и кластер elasticsearch.
Сразу как вариант - zabbix, но меня отталкивает его монструозность.
Второй вариант - графит и графана.
Третий вариант - Shinken.
Что посоветуете?
В качестве системы конфигурации серверов использую puppet.
  • Вопрос задан
  • 2087 просмотров
Пригласить эксперта
Ответы на вопрос 4
ptchol
@ptchol
Linux system administrator
На самом деле, сейчас сталкиваюсь с тем что у людей какое-то очень странное понимание того, что такое мониторинг. Многие под ним подразумевают красивые графички в графане и забывают про алертинг.

1. Zabbix - конечно хорош, но вот удобство его несколько преувеличено. Autodiscovery тоже не самый удобный вариант, все равно приходится генерить кучу разных шаблонов, триггеров и т д, формат JSON'а жестко формализован. Еще из недостатков: нельзя все итемы из одного discovery автоматически поместить на один график, накидав график в latest data нельзя сохранить его как постоянный и поместить на скрин. автоматической генерации скринов из discovery тоже нет. Графики опять же очень удручают тем что они до сих пор рендерятся на сервере, и не оч удобно смотреть значения метрик на графиках состоящих из нескольких датасорсов. Но все же к заббиксу есть https://github.com/alexanderzobnin/grafana-zabbix.
2. graphite + grafana, здесь нет алертинга, придется ставить сторонний (типа graphite-beacon). Но также данные еще чем то нада собирать (collectd/diamond). Также 0.9.10 мертво, пул реквестов в репе куча, никто не занимается проектом, было решение что 0.9.13 будет крайней версией а потом 1.0 но как то все оно еле движется.
3. Shinken - субъективно, помоему он умирает.
4. Если уже есть опыт с Nagios, то посмотрите на Icinga 2. После того как они переписали ядро, и обновили web интерфейс, этим стало можно хоть как то пользоваться.
Ответ написан
saboteur_kiev
@saboteur_kiev
software engineer
zabbix не монстр, просто нужно разобраться.
Простую штуку можете глянуть monit и mmonit
Ответ написан
Все чаще перечисленные системы используются совместно. Например, Nagios для мониторинга доступности серверов и сетей, Zabbix - для снятия метрик с конечных машин.

В вашем случае Zabbix отлично подойдет. Однозначный плюс - autodiscover, простота настройки однотипных серверов и большое кол-во метрик из коробки. Но он легко может сгенерировать большую нагрузку при неаккуратной настройке (избыточное количество часто обновляемых метрик). Для примера: БД с близкими к стандартным метриками и настройками на 4 linux-сервера за 2 года разрослась до 35Gb.
Ответ написан
opium
@opium
Просто люблю качественно работать
В вашем варианте только заббикс подойдет, но блин он такой из начала двухтысячных, хочется конечно чего то нового, но пока ничего хорошего нет.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы