@tartarelin

Как разобраться с простой проверкой в Zabbix с агентом и без?

Есть веб сервер, на котором стоит Debian, крутится несколько сайтов и установлен агент Zabbix, сам сервер стоит в дата центре.
На сервере Zabbix, который стоит в офисе подключил шаблон ICMP Ping и понаблюдал сутки, выходит картина не очень красивая, в среднем 0,72% потерянных.
Прописал как узел сети один из сайтов, что крутиться на этом веб сервере и подключил шаблон ICMP Ping за час 0% ICMP loss, а если смотреть за тот же час по графику для веб сервера с агентом, то 0,56%
Как это понимать?
  • Вопрос задан
  • 1588 просмотров
Решения вопроса 1
@DobriyJuk
Сетевой инженер, системный администратор
Совершенно не удивлюсь, если просто глючит агент. У меня была точно такая же ситуация с серверами. По факту выяснилось, что никто ничего не заметил и всё отлично работало. "Ок" подумал я и просто забил. Средние потери примерно такие-же и были. Плюс бывает вполне нормальная ситуация, когда пакет просто потерялся по дороге (перестройка глобальных маршрутов и пакет попал на недействующий узел). Да много всего может быть. Доступность 99,28% - это хорошая доступность. Даже очень. Пресловутые 99.99% почти никто не может даже в теории обеспечить, т.к. оч.дорого. Очень-Очень дорого.
Например, берем 2-3 датацентра, покупаем ID для BGP сети, настраиваем кластерную ФС между этими датацентрами, настраиваем BGP в сетях 2-5 провайдеров для каждого из дата-центров. Все это обходится нам в несколько миллионов, если не десятков миллионов рублей, но зато доступность будет примерно 99,98%. Потому что может оборудование глюкануть или словить перегруз, а переключение между нодами кластера хоть и занимает милисекунды, но все равно велики шансы потери некоторых пакетов. А может опять же тупануть на этапе перестройки глобальных маршрутов, а может тупануть DNS сервер клиента и вовремя не отрезолвить адрес, у клиента не откроется сайт, а он будет винить вас. Вариантов - 100500 штук.
У вас всё совершенно нормально с доступностью. Не обращайте даже внимание на подобные потери. В крайнем случае, попробуйте отследить момент провала и зайти на сервер в этот момент. Если не заходит, а потом сразу заходит, значит скорее всего вопрос в маршрутизации, который вы никак не решите. Да и вряд-ли вообще кто-то решит. Если долго не заходит (секунд 20-30-60), значит скорее всего проблема с сервером и пусть разбираются хостеры. Ещё могут быть у них проблемы с провайдером и т.д.
Ответ написан
Комментировать
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы