@louvremaster

Почему перезапускается сервер Dell R330?

Есть несколько серверов Dell R330 с процессором E3-1270v5, на всех наблюдается одна и та же проблема, периодически и самопроизвольно сервер перезапускается при этом ругнувшись в ipmi-лог:
57 | 03/31/2017 | 22:47:26 | Unknown #0x2e | | Asserted
58 | 03/31/2017 | 22:47:26 | Processor #0x0d | Transition to Non-recoverable | Asserted
59 | 03/31/2017 | 22:47:26 | Unknown #0x28 | | Asserted
5a | 03/31/2017 | 22:47:26 | Unknown #0x28 | | Asserted
5b | 03/31/2017 | 22:47:26 | Unknown #0x28 | | Asserted
5c | 03/31/2017 | 22:47:26 | Unknown #0x28 | | Asserted
5d | 03/31/2017 | 22:47:26 | Unknown #0x28 | | Asserted
5e | 03/31/2017 | 22:47:26 | Unknown #0x28 | | Asserted
5f | 03/31/2017 | 22:47:26 | Unknown #0x28 | | Asserted
60 | 03/31/2017 | 22:47:26 | Unknown #0x28 | | Asserted
61 | 03/31/2017 | 22:47:26 | Unknown #0x28 | | Asserted
62 | 03/31/2017 | 22:47:26 | Unknown #0x28 | | Asserted
63 | 03/31/2017 | 22:47:26 | Unknown #0x28 | | Asserted
64 | 03/31/2017 | 22:47:26 | Unknown #0x28 | | Asserted
65 | 03/31/2017 | 22:47:26 | Unknown #0x28 | | Asserted
66 | 03/31/2017 | 22:47:26 | Unknown #0x28 | | Asserted
67 | 03/31/2017 | 22:47:26 | Unknown #0x28 | | Asserted
68 | 03/31/2017 | 22:47:26 | Unknown #0x28 | | Asserted
69 | 03/31/2017 | 22:47:27 | Unknown #0x28 | | Asserted
6a | 03/31/2017 | 22:47:27 | Unknown #0x28 | | Asserted
6b | 03/31/2017 | 22:47:27 | Unknown #0x28 | | Asserted
6c | 03/31/2017 | 22:47:27 | Unknown #0x28 | | Asserted
6d | 03/31/2017 | 22:47:27 | Unknown #0x28 | | Asserted
6e | 03/31/2017 | 22:47:27 | Unknown #0x28 | | Asserted
6f | 03/31/2017 | 22:47:27 | Unknown #0x28 | | Asserted
70 | 03/31/2017 | 22:47:27 | Unknown #0x28 | | Asserted

Прошивки BIOS, IDrac, RAID-контроллера и тд свежие
Перезагрузка происходит без разных kernel-panic, в креш ничего не пишется при этом, поведение как дердгается по питанию, но при этом не замечается никаких проблем с питанием.
Кто-нибудь сталкивался с подобным?
  • Вопрос задан
  • 422 просмотра
Пригласить эксперта
Ответы на вопрос 1
AxianLTD
@AxianLTD
Что-то не так с процессором ИМХО:
58 | 03/31/2017 | 22:47:26 | Processor #0x0d | Transition to Non-recoverable | Asserted
Возможно перегревается. Посмотрите детальное ipmi сообщение.
Люди пытались найти решение, ИМХО максимум что получилось linux.debian.user.narkive.com/DuJ14QIu/machine-che...
Перезагружается потому как, видимо, так настроено в ipmi реагировать на сбои. Другой вариант - народ грешит на баг в ядре, из-за которого ядро не видит аппаратного сбоя.
В И-нете немного на тему "dell Unknown #0x28".
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы