Имеется выделенный сервер на hetzner'е, стоит CentOS 6.6, Nginx и прочий стандартный веб-набор.
Время от времени, без каких-либо видимых причин сервер перестает подавать признаки жизни - все входящие запросы по всем доступным портам (80,443,22) уходят в таймаут, примерно как при некорректно настроенных iptables.
Во всевозможных логах ничего подозрительного не наблюдается - они просто обрываются. После перезагрузки из панели хостера все нормально, до следующего раза. Проблема повторяется уже почти год примерно каждые 20-40 дней, какой-либо системности не замечено. В остальном работа сервера нареканий не вызывает.
Обращался в техподдержку - получил отказ с формулировкой "с железом все ок, ищите проблему у себя в системе".
С системой тоже все ок, так как пару месяцев назад переустанавливал систему с нуля (по другим причинам), проблема не исчезла.
Как определить, что становится причиной такого поведения?
MintTea: если у вас VDS, то есть виртуальный выделенный сервер, то ничего никуда не ставят, консоль у вас есть в кабинете. Если у вас реальный сервер, то IP-KVM в рабочее время хецнер ставит минут за 15.
Oioraen: Насчет vds и правда ступил, у меня реальный сервер (ex40). ip-kvm, который они называют lara, я заказывал дважды, его ставили полтора часа в рабочее время и четыре часа на выходных. Возможно, мне не повезло.
MintTea: я в курсе, как они называют, пользуюсь их услугами уже 5 лет, хотя постепенно скипаю от них. Значит не везло, обычно ставят быстро.
Если железный, то могу сказать, что у самого один такой сервер на хецнере был, вдруг перестает отвечать, при чем иногда бывало, что порты держит открытыми, но порты не отвечают по назначению, но чаще просто выходил из оборота, при подключении lara просто не реагировал на клавиатуру, ни паников ядра, ничего в логах, просто вот работал и вот завис. Попробуйте netconsole, я по технической причине на своем таком ее не мог юзать, она с ксеном не совместима. Может он вам перед смертью в нетконсоль успеет что-то сказать.
Как вариант отваливается какой-то модуль. А вообще включите в логах более сильную информативность (может быть даже дебаг), после перезагрузки смотрите их (syslog, dmesg)