Кто как задаёт уровень критичности триггеров в Zabbix?
Доброго времени суток, многоуважаемый All.
А поделитесь, кому не жалко, опытом - кто как задаёт уровень критичности триггеров в Zabbix в зависимости от хоста?
Собственно, вопрос в следующем: у триггеров в Zabbix, как известно, есть уровень критичности события - от Information до Disaster. Задаётся он в свойствах триггера и обычно через темплейты.
Но нюанс в том, что одно и то же событие для разных хостов может носить совершенно разный уровень критичности. Например, нехватка места на диске на каком-нибудь из второстепенных девелоперских серверов неинтересна никому, кроме живущих там девелоперов и вполне может носить уровень лёгкого warning: утром придём, мол, починим. А та же самая нехватка места на боевом сервере Главной Базы Данных должна иметь уровень не ниже Critical и по срабатыванию этого триггера в 3 часа ночи все админы должны подлетать на метр над кроватью.
Хотя теоретически никто не мешает этим серверам мониториться из одного темплейта Linux Server - почему бы нет?
Вот кто как решает эту проблему? Создавать по темплейту на каждую группу серверов? Сильно жирно получается. Прописывать триггеры руками? Бред полнейший, темплейты для этого и придуманы.
Из этой же серии - перезагрузка сервера, неответ на пинги, изменение статуса интерфейса на свитче и так далее.
Делать триггеры с выражениями, оперирующими не константами, а макросами - в этом случае можно для каждого хоста установить свой порог срабатывания триггера, а уровень оставить одинаковый. Ещё более гибко всё это можно настроить, совместив с правилами оповещений, установив для разных групп хостов разные действия и задержки перед отправкой.
Только нужно не забыть установить какие-нибудь дефолтные значения в условия триггера при отсутствии макроса, иначе макрос нужно будет указывать вручную ко всем существующим хостам, чтобы триггер вообще работал.
Решение стоящее. Когда значение триггера одно - всё ясно. Но что делать, если на один параметр навешено несколько триггеров с разными значениями? Например, есть три триггера со значениями 200Гб, 100Гб и 20Гб, с разной степенью важности, установленные на свободное место на диске. Как решать такую задачу?
Роман Наумов: а в чём сложность? В заббиксе есть функционал зависимости триггеров - делаете менее важный зависимым от более важного (или даже сочетания нескольких), в этом случае если закончится место, не будет прилетать сразу три оповещения (на 200, 100 и 20 гигабайт), а только наиболее важное.
Я не об этом. Я о макросах. Когда значение одно: макрос нужен один и триггер один. Когда значений несколько, то получается, что макросов нужно несколько и столько же триггеров под каждое значение. Я пытаюсь нащупать более-менее автоматизированное решение, чтобы руками делать как можно меньше, чтобы, если придётся менять значения для какой-то группы серверов, не забыть что-то где-то поменять.
У нас заббикс интегрирован с системой обработки инцидентов. В заббиксе заводятся различные actions, которые проверяют группу хоста с проблемой, и заводят инцидент соответствующего приоритета.