Задать вопрос
@pejkompolyne

Windows-сервер перезагружается с ошибкой «memory management», что делать?

Есть сервер Windows Server 2019 Standart (лицензия). Появилась проблема, что периодически (обычно раз в день) выбрасывает в перезагрузку с ошибкой "memory management". Понятно, что проблема в памяти. Сделал её проверку, но не пойму лог. Помогите локализовать проблему: плашки менять все, одну, две? Может сам разъем кердыкнул. Просто сервер нельзя отключать на долго и тесты делать мне никто не даст возможности.

Лог:
spoiler
Имя журнала: System
Источник: Microsoft-Windows-MemoryDiagnostics-Results
Дата: 17.12.2023 3:16:29
Код события: 1202
Категория задачи:Отсутствует
Уровень: Ошибка
Ключевые слова:
Пользователь: SYSTEM
Компьютер: srv-1c
Описание:
Память компьютера проверена с помощью средства проверки памяти Windows; обнаружены аппаратные ошибки. Чтобы выявить и устранить ошибки, обратитесь к изготовителю компьютера
Xml события:
<Event xmlns="http://schemas.microsoft.com/win/2004/08/events/event">
  <System>
    <Provider Name="Microsoft-Windows-MemoryDiagnostics-Results" Guid="{5f92bc59-248f-4111-86a9-e393e12c6139}" />
    <EventID>1202</EventID>
    <Version>0</Version>
    <Level>2</Level>
    <Task>0</Task>
    <Opcode>0</Opcode>
    <Keywords>0x8000000000000000</Keywords>
    <TimeCreated SystemTime="2023-12-17T00:16:29.767329500Z" />
    <EventRecordID>263543</EventRecordID>
    <Correlation />
    <Execution ProcessID="2472" ThreadID="2516" />
    <Channel>System</Channel>
    <Computer>srv-1c</Computer>
    <Security UserID="S-1-5-18" />
  </System>
  <UserData>
    <Results xmlns="http://manifests.microsoft.com/win/2005/08/windows/Reliability/Postboot/Events">
      <CompletionType>Fail</CompletionType>
    </Results>
  </UserData>
</Event>

  • Вопрос задан
  • 493 просмотра
Подписаться 1 Простой Комментировать
Решения вопроса 1
Rsa97
@Rsa97
Для правильного вопроса надо знать половину ответа
обнаружены аппаратные ошибки
Для начала рекомендую длительное тестирование памяти Memtest86+, скажем на ночь. Если есть битые планки, то только менять на новые. Если нет возможности остановить сервер, то собирайте новый сервер, переносите всё на него.
Ответ написан
Пригласить эксперта
Ответы на вопрос 3
pindschik
@pindschik
ФЫВА ОЛДЖ
Чаще всего это аппаратная проблема связанная со стабильной работой железа.
Вначале выполните стандартные колдунства:
1) chkdsk c: /f
2) sfc /scannow
3) панель управления - удаление программ, смотрим, что- ставилось ли в последнее время.
4) диспетчер устройств - включить отображение скрытых, удалить все полупрозрачные.
5) выключить сервер, обесточить (тумблером), на обесточенном зажать вкл, подержать, отпустить. Подать питание.
6) Разобрать сервер, вынуть и вставить память.
Выполнять сразу всё вместе.

В Windows NT и по моему - даже до времен XP еще можно было в явном виде задать исключение использования сбойных блоков памяти, но в нынешних серверах - искал, не нашел инфы.
Ответ написан
Комментировать
@SunTechnik
Что за железо?

Может у сервера есть мониторинга (iDRAC у DELL, iLo у HP). Они подскажут какой dimm неисправен.

Если память с ecc, можно посмотреть на каком модуле больше всего корректируемых ошибок.
Скорее всего он и неисправен.
Ответ написан
Комментировать
mindtester
@mindtester
http://iczin.su/hexagram_48
сервер нельзя отключать на долго и тесты делать мне никто не даст возможности.
если бизнес 24/7, допустим.. а на сколько он доходный?
- если доходный, закупайте новое железо и переносите сервер
- если нет, ищите новую работу по тихому.. пусть скупые продолжают экономить
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы