Примерно пару недель назад Zabbix начал ругаться на один из серверов что у него высокий пинг.
Ошибка появляется на минут 15 и исчезает. - думал что это перегрузка сетевого адаптера, искал что нагружает, есть ли бэкапы или задачи на эти интервалы. Как оказалось ничего такого нет.
Начал капать глубже и увидел вот такую картину - резкий скачек пинга и медленный его спад. При этом такое только на каждом втором пакете:
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время=779мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время=774мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время=737мс TTL=128
Ответ от 192.168.0.9: число байт=4 время=1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время=700мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время=668мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время=648мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время=610мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время=563мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время=514мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время=469мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время=436мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время=388мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время=339мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время=299мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время=269мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время=253мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время=208мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время=158мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время=113мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время=72мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время=35мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Ответ от 192.168.0.9: число байт=4 время<1мс TTL=128
Драйвер новый. Изменений в политиках или в конфигурации сети за последнее время не было. Наоборот, даже снизил нагрузку на сеть в угоду удаленщикам.
Куда копать? Че делать?
Возникает в одно и то же время?
С других узлов какой пинг? С других узлов во время того как заббикс ругается какой пинг?
Другие узлы с сервака с заббиксом пингуются без подобных проблем?
Время разное. Привязать к конкретным процессам не удаётся.
С других узлов К серверу пинг тот же. Сами узлы пингуются нормально.
Другие узлы забиксом пингуются нормально. Даже те что за VPNом.
На сервер случаем не установлен Аваст?
У меня было похожее, только пинг вообще пропадал при запуске Хрома. После переустановки антивирусника попустило.
Не хватает инфы!
У Вас проблема может быть в 3 местах: на пк которое пингует, сеть, пк(сервер) которого пингуют.
По-моему нет проблем исключить 1 и 2: пингуем с других пк из других сетей.
Сервер линукс? Крутить логи сервера, Wireshark повесить на протокол ICMP на сервере.
Удачи!
Тогда остаётся сеть или сам сервер. Судя по ip вы в сети сервера. Значит сервер.
На блокировку пакетов не похоже. Хотя может быть из-за каких нибудь барьеров (firewall, ddos и т.д.)
Возможно в сети нагрузка, тоже спадающая.
Можно попробовать увеличить интервал между пакетами и увеличить размер пакета (не знаю как это сделать в виндовом пинге).
Но логи и wireshark должны имхо подсказать! Интересно, а пинги с сервера в этот момент?
Но я бы написал скрипт, который "ждёт" долго пинга, а дальше:
1. контроль нагрузки в сети
2. нагрузка на сервер
3. пинг с сервера и т.д.
4. запустить скачивание большого файла для сравнения скорости скачивания
- но это всё плохая практика)) Нужно уметь ковырять логи, wireshark и т.д.
Удачи!