@synapse_people

Как проверить память на сервере?

Очень часто (раз в час) вылетает строки в сислог:
Message from syslogd@debian at Apr 15 10:51:23 ...
 kernel:[ 1873.150211] [Hardware Error]: Corrected error, no action required.

Message from syslogd@debian at Apr 15 10:51:23 ...
 kernel:[ 1873.150228] [Hardware Error]: CPU:6 (10:8:0) MC4_STATUS[Over|CE|MiscV|-|AddrV|CECC]: 0xdc4a400053080813

Message from syslogd@debian at Apr 15 10:51:23 ...
 kernel:[ 1873.150238] [Hardware Error]: Error Addr: 0x0000001729eb00e0

Message from syslogd@debian at Apr 15 10:51:23 ...
 kernel:[ 1873.150243] [Hardware Error]: MC4 Error (node 1): DRAM ECC error detected on the NB.

Message from syslogd@debian at Apr 15 10:51:23 ...
 kernel:[ 1873.150274] [Hardware Error]: cache level: L3/GEN, mem/io: MEM, mem-tx: RD, part-proc: SRC (no timeout)

в связи с чем вопрос, я так понимаю проблема в памяти? Как можно ее проверить, если она ECC?
  • Вопрос задан
  • 343 просмотра
Решения вопроса 1
Zoominger
@Zoominger
System Integrator
Если есть возможность, то прогоните через memtester. Тут, правда, бабка надвое сказала - память может корректировать битые данные и до memtest ошибка не долетит.

Вообще, ЕЦЦ на то и ЕЦЦ, чтобы администратор не заморачивался ошибками памяти, вот вам даже пишут:
Corrected error, no action required.


Так что лично мой вердикт: не обращайте внимания. Если начнут вдруг крашиться программы и паниковать ядро, вот тогда обращайте.
Ответ написан
Пригласить эксперта
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы