HP microserver gen8, ESXI, проблема с дисками?

Question

Марат @magliullin

HP microserver gen8, ESXI, проблема с дисками?

Коллеги здравствуйте, подскажите кто сталкивался, на HP Microserver gen8 развернут ESXI 6.5 некоторое время получаю уведомления:
blk_update_request: critical target error, dev sda sector XXX
Как следствие некоторые из виртуальных машин могут уйти в initramfs соответственно сервис падает, это может произойти в любой момент времени. Диски работают в RAID 1+0 под контроллером HP b120i. Мониторинг состояния на самом сервере говорит что диски ОК.
Подскажите куда копать. Есть мысль остановить сервер и по очередно прогнать статус SMART на каждом из дисков.

Вопрос задан более трёх лет назад
549 просмотров

6 комментариев

Подписаться Простой 6 комментариев

Пригласить эксперта

Ответы на вопрос 3

3 комментария

Марат @magliullin Автор вопроса

Данные забекапил, попробую пойти путем теста наиболее старого диска, если диск жив, поставлю обратно, дождусь ребилда и пойду к следующему (поскольку не имею возможности остановить работу сервисов полностью), в этом перерыве посмотрю будут ли ошибки при работе с одним из дисков.

Написано более трёх лет назад
Zettabyte @Zettabyte

Марат,
Данные забекапил

Главное - убедитесь, что в копии они целы. Мы видели самые разные развлекухи с пропаданием/повреждением файлов в "многослойных" системах.

попробую пойти путем теста наиболее старого диска, если диск жив, поставлю обратно, дождусь ребилда и пойду к следующему

Тоже вариант.
Если вы точно знаете как делается ребилд, т.е. "корректный", а не forced rebuild, то на извлекаемых дисках вы можете делать и тесты записи.

Вообще говоря, полный тест записи, а после него - полный тест чтения (который read, не verify) - это лучшая проверка диска без спец. оборудования.

Только не забывайте, что при ребилдах и тестах на диски будет повышенная нагрузка, и если какому-то нехорошо, он может выйти из строя. Так что имейте копию файлов, и будьте готовы ставить замену, либо хотя бы быстро её купить.
Пятница всё-таки :)

Написано более трёх лет назад
Марат @magliullin Автор вопроса

Zettabyte, спасибо за развернутый ответ, ребилд стартовал автоматически, после установки нового диска, на этот процесс я не влиял никогда.

Написано более трёх лет назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Ubuntu

+1 ещё

Простой
Ubuntu 22.04 ошибка sorry there was a problem completin в esxi. Как победить?
- 2 подписчика
- вчера
- 303 просмотра
1

ответ
Железо

+2 ещё

Простой
Что произойдет с кабелем usb 3.0 если в нем будет оборвана жила? Он опустится до 2.0 или в принципе откажется работать?
- 2 подписчика
- 14 апр.
- 496 просмотров
3

ответа
VMware

Простой
How do I force traffic between ESXi and TrueNAS to use the 10Gbps link instead of 1Gbps?
- 2 подписчика
- 14 апр.
- 89 просмотров
1

ответ
Linux

+1 ещё

Средний
Как восстановить раздел и информацию на нём в Linux Kubuntu?
- 1 подписчик
- 12 апр.
- 172 просмотра
1

ответ
Linux

+1 ещё

Простой
Как настроить програмный Рейд 1+0, на линукс?
- 2 подписчика
- 12 апр.
- 523 просмотра
3

ответа
Windows

+3 ещё

Простой
После переустановки Windows диск недоступен, зашифрован BitLocker-ом. Как получить к нему доступ?
- 5 подписчиков
- 27 мар.
- 21653 просмотра
13

ответов
Жёсткие диски

+1 ещё

Простой
Как 1TB может записаться на 931Gb?
- 1 подписчик
- 26 мар.
- 470 просмотров
6

ответов
Linux

+2 ещё

Простой
Как исправить проблему со звуком в vmware?
- 2 подписчика
- 22 мар.
- 226 просмотров
0

ответов
VMware

Средний
Как я могу сделать так чтобы каждая моя виртуальная машина была с разным железом и можно что-то сделать чтобы епл не видел что это вирт машина?
- 2 подписчика
- 21 мар.
- 302 просмотра
0

ответов
Виртуализация

+2 ещё

Простой
VMware ESXi 7 на старом железе?
- 2 подписчика
- 15 мар.
- 590 просмотров
1

ответ
Показать ещё Загружается…

Администратор PostgreSQL

Гринатом

До 200 000 ₽

Ведущий backend разработчик (C# & ASP.NET Core)

ГК «ЭкоНива»

от 250 000 до 350 000 ₽

Инженер систем хранения данных / СХД

Wanted. • Москва

До 250 000 ₽

Чтобы проверить SMART не нужно ничего останавливать
Армянское Радио, Диски в рейде и управляются контроллером с контроллера кроме как статус OK не получить.
Марат, Есть какбы пакет утилит командной строки, который позволяет достучаться до контроллера и опростить статус дисков.
Армянское Радио, Верно, он и отдает только статус.
Марат, проверьте логи контроллера тогда. Если ошибка записи/чтения на диске с RAID, и рейд в остальном цел, это не диски.
Максим Гришин, Спасибо, изучу вопрос.

Answer 1 · 2021-10-15 17:40:08

В первую очередь сделайте копию всех важных данных на сервере и убедитесь, что в копии они не повреждены.

развернут ESXI 6.5 ... Диски работают в RAID 1+0 под контроллером HP b120i

ESXI и RAID-контроллер - это действительно, два "слоя", которые могут помешать взаимодействию с дисками напрямую. Как минимум, с рэйд-контроллером надо изучать как работает он сам, что позволяют его драйверы, и какой софт доступен.

Если не получится пробиться в родной ОС, то пронумеруйте диски, разберите массив, и подключите диски напрямую к компьютеру с Виндоус. Windows давно стала отраслевым стандартом в data recovery и весь самый интересный софт разрабатывается под неё, независимо от того, с какими накопителями ведётся работа. Если она предложит инициализировать/форматировать диски, или запустит проверку - откажитесь / остановите.

Скачайте и распакуйте R.tester: https://rlab.ru/tools/rtester.html
В нём можно как посмотреть SMART, так и сделать максимально детальные тесты чтения, которые покажут состояние поверхности.
Можно также сделать тесты записи, но они уничтожают всё безвозвратно, так что предварительно надо готовиться (бэкапить данные или делать образы дисков).

Answer 2 · 2021-10-24 09:30:47

По итогу:
Вытащил старый диск который отработал 40 тыс часов, состояние которого в целом не плохое, bad секторы отсутствуют, smart проходит.
Неделю esxi работал на 1 диске и проблема не возникала все неделю, вставил второй, редилд прошел и на второй день появилась аналогичная ошибка.

Answer 3 · 2023-04-10 00:38:01

rule184 @rule184

Прошивки для диска стоит проверить, особенно если это seagate

Ответ написан более двух лет назад

Комментировать

HP microserver gen8, ESXI, проблема с дисками?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт