yurybx
@yurybx
системный администратор

RAID-контроллер HBA H240 скрывает все тома, если хотя бы один диск не подключён. Это нормально?

День добрый, коллеги!
На предприятии в сервере работает это чудо: HPE HBA H240. Работает вроде бы хорошо, но есть вопросы. Вот сейчас на тестовой машине с таким же контроллером играюсь и вижу странное поведение: если отключить один из дисков (которые в зеркале) и попытаться запустить сервер, то окажется, что ни один диск недоступен (не отображается в О/С), а Smart Storage Administrator пишет, что мол:
"Critical Status Message(s). Bay 6 is bad or missing. To correct this problem, check the data and power connections to the physical drive."

А ssacli выдаёт ещё более интересное предложение:
One or more physical drives in array <0ID> on the cache module has been moved, are missing, or have failed. To correct this problem, restore the configuration to its original state or delete the array and save your configuration.

То-есть, если у меня внезапно вышел со строя один из накопителей, то у меня сервер полностью ляжет при следующей перезагрузке, и у меня будет только два варианта:
1. Найти подходящий запасной диск;
2. Удалить проблемное зеркало, потеряв данные на нём, тогда остальные тома станут доступными.
И у меня возникает вопрос: а в чём тогда смысл зеркалирования? По-идее, контроллер должен подтянуть все тома даже если у каждого зеркала отвалится по одному диску. Разве не в этом смысл зеркалирования? А если у меня не будет под рукой подходящего накопителя? А если дело будет в Новый Год?
Может это поведение где-то настраивается? Поделитесь опытом/мыслями.
  • Вопрос задан
  • 419 просмотров
Пригласить эксперта
Ответы на вопрос 3
saboteur_kiev
@saboteur_kiev
software engineer
С этим контроллером не имел дела, но странно что не стартует.

Но при включении компа в адекватном контроллеры обычно выборы такие:
1. Стартовать ОС как есть, с одним диском, (игнорировать что второй вылетел)
2. Вставить новый диск, запустить c ним ребилд и запустить ОС уже после ребилда.
3. Вставить новый диск, запустить ребилд в фоне, и сразу запустить ОС. Обычо настраивается процент ресурсов, который можно использовать на фоновую задачу ребилда.
4. Если рейд поддерживает hot spare, он может быть настроен так, чтобы при сбое одного из дисков, зеркало автоматически запускало ребилд на тот диск, который указан как hot spare

Удаление информации о рейде раньше обычно означало переформатирование диска.
То есть конвертнуть диск из рейда в стенд элон с сохранением информации, штатные утилиты рейда раньше не поддерживали, даже если там разница только в бутсекторе. Может быть сейчас уже не так.

Поддержу Алексей Черемисин - софтрейд сейчас вполне норм, и хардварный рейд обычно нужен только для hi-end решений, когда на железке есть и свой большой кеш и батарейка и процессор, который будет все это решать там хороший стоит, и обычно хардварный рейд для решений из большого количества дисков, с корзиной для них.
Ответ написан
leahch
@leahch
3D специалист. Dолго, Dорого, Dерьмово.
Чтобы происходила автоматическая починка RAID нужно плюс один диск (но все зависит от конкретной конфигурации).
Этот дополнительный диск обычно называется Hot Spare. И при вылете одного из дисков массива происходит автоматическая подмена выбывшего диска на этот.
Во всех остальных случаях, да, имейте ЗИП и подменяйте ручками :)
Ну или отказывайтесь нафиг от железки и делайте программный RAID, что я и практикую последние лет 20. Ибо, не только не поднять, но и полный швах происходит, если сгорел сам контроллер, а под рукой нет какого-же аналогичной марки. Что всем и советую. (только не нужно гнать про "скорость", iops, разгрузку процессора и прочее, не нужно, ибо железо правильно подбирать надо)
Ответ написан
yurybx
@yurybx Автор вопроса
системный администратор
Я повторил эксперимент, но в этот раз выдернул SATA-кабель во включенном состоянии, прямо во время работы. Система продолжила работу, как ни в чём не бывало (как и должно быть), все тома, включая деградировавший, остались доступными. Затем я перезагрузил компьютер, но ничего не изменилось: все тома доступны. Значит, контроллер блокирует тома только в том случае, когда диск отваливается в выключенном состоянии. Ситуация крайне маловероятна, но всё же возможна: если диск выйдет со строя в момент очередного запуска, то получим отвал всех томов. Ну, что же, буду иметь ввиду.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы