Имеется домашний сервер, собранный из обычных десктопных запчастей, на метери ASRock 970 Extreme 3. Время от времени сервер намертво виснет, без логов, без звуков - полагаю это какое то аппаратное зависание, т.к. ядро линукс с параметром panic=5. Между зависаниями может пройти дней 80 а может и пара часов.
Как определить из за чего это зависание происходит? Есть мысля запилить в ядро netconsole, но тогда придется оставить домашний комп включенным "ловить вывод".
В момент предполагаемого зависания в логах нет вообще ничего, ни одной строки, вообще... Отсюда я делаю вывод что зависание скорее всего аппаратное, просто напросто останавливается выполнение команд и ядро даже не имеет возможности среагировать...
Не пробовал, при следующем зависании попробую, но есть сомнения, т.к. нум-лок, капс и скрол-локи - не работают во время зависания, как и остальные клавиши\сочетания (пробовал Ктрл+Альт+Дел :D ).
@iamFake Ну попробуй прикрутить мониторинг температуры в логи. Может быть перегрев. Можно попробовать переткнуть винт на другой молекс питания. Может быть действительно не хватает в какой то момент питание и оно проседает.
@ZoomZoom а разве проблемы с БП не должны приводить к ребуту или полному отключению, а не к зависанию?
@oia у меня ядро скомпилено с опцией panic=3 (щас посмотрел специально), и команда sysctl kernel.panic выводит kernel.panic = 3 и это не помогает... в момент предполагаемого зависания в логах нет вообще ничего, ни одной строки, вообще... отсюда я делаю вывод что зависание скорее всего аппаратное, просто напросто останавливается выполнение команд и ядро даже не имеет возможности среагировать...
Проверить оперативу. Далее, если есть возможность, подключить другой БП и диски, посмотреть работу в простое. Если проблема не решается, то мать битая. Ремонтом таких может заниматься только специалист определённой квалификации (после 2 месячных мучений свою я отдал на запчасти, хотя у меня больше 3 дней не работала).