Отваливается IP на сервере, не резольвится, не пингуется, где искать проблему?
Друзья, с недавних пор резко начались проблемы с доступом к сайтам на VPS сервере.
Что имеем: 2 IP адреса, несколько доменов, Debian 8.
Основной сайт сидит на основном IP адресе. С доступом из браузера к нему проблем не замечал. Но проблема есть при запуске различных скриптов для автоматизации процессов импорта-экспорта. Скрипты запускаю не через CURL, а через file_get_contents. Но способ запуска к сути не относится.
Скрипты начинают подтягивать друг друга по цепочке, и если первый запустился, и запустился в цикле тысячный раз, то в неопределенный момент может не запуститься. Удалось отследить ошибку php_network_getaddresses: getaddrinfo failed: Name or service not known. Многие сейчас скажут - копай на resolv.conf, смотри DNS. Копал уже и там, менял настройки. Но сам файл не менялся с момента запуска сервера,т.е. проблема по сути явно не в нем. Смотрел etc\network\interfaces. Добавлял ко второму ip шлюз, (по умолчанию его там нет), ничего не меняется. Вся эта ошибка бросилась мне в глаза из-за доступа ко второму домену на втором IP. Сайт может открываться, может не открываться, браузер висит на поиске IP. Живет своей жизнью и причем гораздо хуже, чем основной IP. Доступа по IP в этот момент тоже нет. Т.е. DNS трабла отпадает я так понимаю. Доступ по SSH есть, соединение если установлено, то не отваливается сутками через PUTTY (соединение через основной IP).
DMESG смотрел, всё там ОК, изредка ругается на фантомную нагрузку ядра, при выполнении тяжелых скриптов обновления. Ошибок нигде в других местах нет.
Подскажите, что копать и где ковырять. К хостеру обращаться бесполезно, подозреваю на аппаратные траблы в железе, может чтото у них с оборудованием в маршрутизации, но чтобы на это им указывать нужно проверить свой сервер.
Посоветуйте, может есть какие-то скрипты Sh, которые мог бы запустить и выявляли бы проблему, аппаратная она или нет. Както логгировать может, ошибки аппаратные гдето выявлять.
ОЗУ вроде как везде хватает, ругани со стороны php-fpm и мускуля нет. Поиск Sphinx работает тоже без вылетов, базу в 3,5 млн строк индексирует без вылетов. Сайт без проблем держит 30 одновременных запросов в секунду. Т.е. формально всё ок, но иногда отваливаются IP. Что еще посмотреть? Установлен Monitorix, этот криминал на графиках мне незаметен.
Если "К хостеру обращаться бесполезно", то мой Вам совет - хостера нужно менять.
Проблема может быть банальна, когда Ваш IP висит на чужой виртуалке и соответственно трафик идёт к нему. Проверить можете командой arping в момент сбоя его работы, но вообще этим должна заниматься поддержка хостера.
В крайнем случае, попросите заменить проблемный IP-адрес.