Какими способами можно диагностировать причину зависания PC с OS Windows?
Всем доброго дня, вопрос задан очень в общем, а если конкретней то имеется:
HP Proliant DL360p gen8, на нем - Windows server 2012 R2 x64
Периодически, примерно раз в сутки система зависает, не просто отваливается из сети а именно зависает, захожу через ILO - черный экран, в логах событий системы: до зависания - никаких событий уровня Error или Critical, после перезагрузки появляются :
1. Critical Kernel-Power Event-Id - 41
2. Error SNMP Event-Id - 1500
3. Error NETLOGON Event-Id - 5719
4. Error Storage events Event-Id - 1204
5. Error HP Smart Array Event-Id - 8
6. Error HP System Event-Id - 1001
(В порядке возрастания по времени)
После этого сервер работает исправно и беспроблемно около суток после чего опять зависает, без блюскрина без каких либо сообщений об ошибках, не создавая никаких дампов, т.е. даже непроанализировать ничего, причем зависает примерно в одно и то же время что странно.
Подскажите есть ли какоето ПО чтобы можно было его запустить и оно вело бы с настраивамой частотой лог всего чего можно в системе - работы всего оборудования и софта
чтобы по логам проанализировать что происходило в системе непосредственно перед зависанием, что могло это вызвать
Нужно сначала решить, причина проблем в железе или в софте? Началось это после каких то изменений? Софт установили, обновили? Увеличилась нагрузка, например пользователей стало больше?
Постарайся перенести работу на другое железо, а над этим начинай издеваться, постепенно меняя нагрузку и уменьшая (буквально отключая/удаляя используемые приложения).
Запусти linux, у него в логах в момент смерти иногда встречается полезное, можно кстати перенести windows в виртуалку запускаемую на этой машине (не скажу что это правильно но к примеру если вам надо работать и другой машины нету). БАКАПЫ! обязательно без вариантов.
Самые тяжелоотлавливаемые проблемы - аппаратные
P.s. пальцем в небо, зайди в BIOS и отключи все что связано с ACPI к примеру
Никаких изменений небыло, доп. софт не устанавливали и не обновляли, разве что если какие то обновы от мелксофт причинили проблемы (бывает с их обновами такое), на другое железо не перенести ничего, ничего не отключить, не удалить, linux - ну только если на виртуалке и с внешнего hdd или флешки, ничего переустанавливать нельзя, вот последнее кстати надо попробовать
Nordman99, нет linux имеет смысл именно на железе, его логи покажут больше информации.
внешний диск вполне вариант, пробуй, симулируй нагрузку по простому - бенчмарками и синтетическими тестами, потом виртуалку со своей виндой в linux запусти, подними там похожий софт к примеру (не обязательно базы копировать, тупо систему скопируй)
rPman, какой линукс для этого лучше? Где и какие там логи смотреть? В линуксе работал но скорее как на дектопе а не на сервере, и изучением логов там еще не занимался
Абсолютно не важно, берешь любой livecd той же ubuntu (если делать с помощью unetbootin можно указать место на диске для сохранения изменений, чтобы не в памяти хранились), запускаешь, ставишь на нее какой-нибудь performance test suite пакет, прямо из интерфейса, там gui установщик есть (тормозной жесть, иногда мне кажется что люди из каноникал сначала сделали все для популяризации linux а потом опомнились и стали делать все специально плохо), тут же можно поставить виртуалку и запустить в ней свой windows сервер но настоятельно рекомендую делать это не на оригинале а на копии.
rPman, Только вот боюсь что линукс не поможет, т.к. во 1ых линух стабильнее винды и скорее всего не будет падать, а во 2ых проблема скорее всего в настройках этой винды, которых уже не будет ни в новой винде ни есс-но в линухе, поэтому диагностировать нужно как то происходящее именно в этой винде
Через ILO нет проблем - что можно увидеть через ILO кроме черного (или синего)
экрана если система зависла? Остается потом через ило только резет сделать, дальше все видно нормально