Как идентифицировать проблемы в zabbix web monitoring?
Контролю несколько сайтов через заббикс веб мониторинг, более прелестной и не прозрачной вещи в мониторингах не встречал.
В мониторинге проверяю только один шаг возврат 200 ответа
Время от времени принодят алерты про сайты падают.
Проверяю логин nginx везде вернул он 200 ответ в иррор логе тоже все чисто.
В заббиксе же вообще нет возможности посмотреть в чем же проблема в вебмониторинге, известно только, что она была.
Как быть? Куда копать?
у zabbix сервера и клиента есть логи, где внятно пишутся ошибки.
При не внятных значения всегда можно изменить модель опроса что распарсить ошибку полностью. В вашем же варианты надо изменить поведении опроса - и бить тревогу не после одного не верного ответа, а после трех повторов.
Ну как бы агент то тут ни причем, так как он не участвует в мониторинге, как изменить модель опроса? Чем три неверных ответа лучше или хуже чем один? Как бы понятно, что заббикс ещё то говно и многое там не по человечески, но оставлять ложные срабатывания это даже не костыль, это выстрелить себе в ногу. А вдруг сайт упал, а я третьего срабатывания?
Я бы на вашем месте не хаял столько категорично весьма распространенную систему мониторинга только из-за того, что вам не удаётся настроить её для собственных нужд.
По теме: напишите, плз, выражение ложно срабатывающего триггера. Подозреваю, присоединяясь к товарищу выше, что он настроен орать при единичном ответе != 200 ОК, в данном случае лучше поменять на что-нибудь типа проверки значений за некоторый период времени.
Ну как бы я очень много с ней работаю и уж Владищева вспоминаю частенько. У меня даже сосед через стенку открыл http://huyabbix.com/ . Просто когда простые конфиги и проверки там конечно не видишь всей поднаготной, а когда копнешь как следует то осознаешь всю прелесть жизни. Так в том то и вопрос там всегда 200, там нет никаких !=200, на не равно 200 это было бы логичное поведение сайт упал и надо орать алертом, но сайт то не упал и возвращает 200, зачем алерт что он не 200, когда он 200.