Выбор системы мониторинга сети и ПО

Приветствую!

Для небольшой компании (макс 50-70 наблюдаемых машин) необходимо выбрать систему мониторинга сети и ПО. Мониторить в первую очередь будем именно критически важное (24х7) ПО — логи, производительность и доступность.

Вопрос стоит в выборе. Есть большой соблазн использовать Zabbix, но все же хочется объективно оценить все плюсы и минусы каждой системы.

Кандидаты:
Cacti
Nagios
OpenNMS
AggreGate Network Manager
Zenoss
Pandora FMS
PRTG Network Monitor
NetDecision
Zabbix
Ganglia

Рад буду услышать отзывы о реальном (рекламные брошюры все уже прочитали) использовании этих систем. Интересуют такие качества как:
— простота установки и поддержки;
— расширяемость;
— производительность;
— надежность;
— визуализация данных;
— распределенный мониторинг;
— эскалация инцидентов;
— широкий набор оповещений;
— цена;

Также интересует, подходят ли для подобных целей «взрослое» ПО по управлению информационными системами, такое как IBM Tivoli или HP OpenView?

Буду рад слышать ваши ответы и предложения.
  • Вопрос задан
  • 40283 просмотра
Пригласить эксперта
Ответы на вопрос 5
3vi1_0n3
@3vi1_0n3
Использовал nagios для мониторинга примерно 300+ машин
1) простота установки и поддержки — есть в пакетах во многих дистрибутивах, настраивается достаточно просто
2) расширяемость — много плагинов, в том числа для сетевого оборудования, можно писать свои, достаточно будет написать шелл-скрипт, который пишет данные в определенном формате.
3) производительность — для 300+ машин серверу хватало 256 Мб, при этом там еще работал OCS Inventory
4) надежность — как кирпич, очень надежно.
5) визуализация данных — присутствует, красота на любителя.
6) распределенный мониторинг — не совсем понял, что имеется ввиду. Если это то, о чем я подумал, то существует NRPE, который выполняет удаленно плагины на хосте и отдает ответ плагина серверу мониторинга. Если имеется ввиду использование нескольких серверов мониторинга в связке, то не уверен, что на предприятии в 50-70 машин это нужно.
7) эскалация инцидентов — не готов сказать что-то конкретное, не представляю, какая у вас на предприятии с этим ситуация, какова иерархия управления инцидентами. Исходя из размера компании, один технический специалист и пара-тройка человек руководства.
8) широкий набор оповещений — можно разделять пользователей на группы, указывать, на какие группы высылать оповещения, стандартно используется три состояния сервиса или параметра — OK, WARNING, CRITICAL. Есть еще статус UNKNOWN, возникающий в случае некорректной работы плагина.
9) цена — бесплатно
Плюс есть возможность выполнения скриптов удаленно в случае возникновения критической ситуации. Например, передернуть сервис.
Кроме того, можно использовать координатную отрисовку на карте. Задаешь координаты для всех машин и на схеме наблюдаешь где это находится. Правда, придется немного озаботиться с заданием координат.

Cacti больше подходит для мониторинга по SNMP, соответственно, удобнее им мониторить сетевое оборудование, я лично для этого использовал плагины для nagios'а.

В общем, из своего опыта советую nagios.
Ответ написан
liveder
@liveder
opsview community edition
Ответ написан
liveder
@liveder
сугубо имхо
cacti больше подходит для мониторинга сетевого оборудования — его система графиков очень удобна.
zabbix — скорее походит на лайт версию нагиуса.
nagios — очень маневренный монстр. но интерфейс настолько не красив, что аж страшно.
opsview — надстройка над nagios'ом. очень красивая.
на базе opsview легко создается распределенная сеть мониторинга. Можно создавать кластеры.
Ответ написан
@alienrom
По поводу второго вопроса.
HP OpenView не щупал, а вот Tivoli подходить для ваших целей лучше всех вышеперечисленных, но вот только есть один ньюанс — цена на них явно не на небольшую компанию.
От себя советую Cacti(Nagios) + Munin
Ответ написан
Комментировать
@zionkv
Системный администратор Windows\Linux
Автор, я такой же вопрос недавно задал, к чему вы пришли? Каков результат?
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы