Почему происходит внезапная перезагрузка серверов?
В нашей серверной 10 серверов, но с двумя из них происходят очень специфичные вещи. Почти каждую субботу в 3 ночи они неожиданно перезагружаются. По логам все выглядит так, словно питание отключили, а по Last State он потом включается.
Переустановка ОС несколько раз, изначально ставили Windows 2008 R2 SP1. Для теста на одном из них поставлена Windows 2003 Sp2. Из дополнительного ПО стоит DrWeb 8, Java, форк Firebird, Tomcat (в других серверных набор ПО такой же).
Был подключен через оффлайновый ИБП, сейчас переключили на ИБП с двойным преобразованием, но проблема остается. В планировщике левых заданий нет. Память и HDD/SSD проверены не раз.
Есть третий сервер того же закупа и такой же конфигурации, только с большим объемом памяти, установлен в той же серверной, с ним проблем нет.
Уже не представляю в какую сторону копать, с учетом того, что происходит это как по расписанию.
Служба отключена, в любом случае нет доступа в интернет с этих серверов, сейчас стоят две разных ОС (w2k3sp2 и w2k8r2sp1), но проблема происходит на обоих.
Ну тогда память. Практически все внезапные перезагрузы связаны с некорректной работой памяти. Ставил новый сервер на этой неделе, пришел с глючной палкой оперативки. После замены вылеты прекратились
Почему в 3 часа ночи в субботу? Все бэкапы на серверах к тому времени уже заканчиваются, сервер работает в штатном режиме, пользователей нет. Память тестировали, в Event Log в БИОС событий нет.
@custos тоже думали про БП, но непонятна привязка к времени. Думали на какие-то плановые технические работы на соседнем промышленном объекте, что даже оффлайновый ИБП не помогает. Какой-нибудь импульс, на который ИБП не реагирует, а капризные БП реагируют. Но сейчас подключено через онлайновый ИБП.
Для правильного вопроса надо знать половину ответа
А может просто электричство надолго отключают или оно просто проседает ниже порога ИБП? Какая-нибудь программа для контроля ИБП установлена? Настройте в ней логи и посмотрите, что происходит.
Сервер, который подключен к тому же ИБП
uptime
11:56:48 up 29 days, 2:33, 1 user, load average: 1.61, 1.84, 2.06
причем перезагрузка 29 дней назад - плановая.
Копать в сторону Windows Auto Maintenance. Или Windows Updates. Там есть опции в Policy где указывается когда можно перегружаться и можно ли перегружаться вообще