@UniverseElement

Как спасти RAID?

Из четырех HDD был настроен RAID10 (Intel Matrix Storage Manager), на нем создано 2 раздела:
- c:\ (с Win2008R2)
- d:\ (с данными).

Сервер начал как-то странно тормозить. Запустил рээйдовскую софтинку - сказала: "массив и диски норм". Посмотрел СМАРТ - из примечательного: "диски с большой выработкой по времени".
После перезагрузки один диск совсем пропал из биоса рэйда. Попробовал добавить вместо него SSD-диск, но что-то пошло не так и система не запустилась. Потом дежурные помощники без понимания сути пытались восстановить загрузчик и похоже испортили его. Я в этом деле тоже полный ноль.

В итоге рэйд видит 3 диска из 4-х. Загрузился с Live-CD (Windows Server) и вижу в проводнике:
- загрузочный раздел (открывается);
- раздел с системой, который был с: (открывается);
- раздел с данными (при попытке открыть - "Структура диска повреждена. Чтение невозможно.").

Не понимаю, что происходит((
А как же зеркалирование?
И почему тогда диск c: видно, а d: нет?
Можно как-то восстановить загрузчик, чтобы хотя бы с диска c: загрузилась система (может потом и d: прочитается)?
Стоит ли пытаться оживить в сервисе четвёртый диск?
Есть вообще шансы на успех?
  • Вопрос задан
  • 392 просмотра
Решения вопроса 1
Zettabyte
@Zettabyte
Проф. восстановление данных ▪ Вопрос? См. профиль
Попробовал добавить вместо него SSD-диск, но что-то пошло не так и система не запустилась
Вот тут, конечно, хорошо бы более подробное описание. Хотя бы о продолжительности "похода не так".
Не видели ничего похожего на RAID rebuild в процессе?

Потом дежурные помощники без понимания сути пытались восстановить загрузчик и похоже испортили его
Вот это, к сожалению, тоже звучит не очень.
Как именно они "пытались восстановить загрузчик"? Что было сделано и с какими результатами?

Можно как-то восстановить загрузчик, чтобы хотя бы с диска c: загрузилась система
Не нужно ничего восстанавливать, в т.ч. работоспособность системы. Сейчас основная задача - восстановить данные, её и нужно решать. Систему, с заметной вероятностью, лучше будет переустановить заново.
В рамках работы по восстановлению избегайте любой записи данных на диски - форматирование, инициализация, ребилд, и т.п.

А как же зеркалирование?
Оно должно быть. RAID 10 - это страйп из двух зеркал.
Грубо говоря, у вас все данные пишутся на массив "кусочками" одинакового размера. Нечётные куски уходят на первую пару дисков, чётные - на вторую. Внутри каждой пары содержимое дисков идентично. Так что в теории данные можно восстановить, имея по одному диску из каждой пары, в реальности - бывают нюансы.

Есть вообще шансы на успех?

Да, есть, ввиду описанного выше.
Если вы можете пронумеровать диски, сделайте это. Если знаете какой именно винчестер вышел из строя, то отложите его в сторону и пока не делайте вообще ничего, даже не пытайтесь включить.

Дальше индивидуально подключите живые HDD напрямую к другому компьютеру с Windows. Если она предложит какие-либо инициализации, проверки, форматирование, что угодно - отказывайтесь. Диски надо увидеть как устройства, это всё, что нужно.
Дальше скачайте бесплатный R.saver: https://rlab.ru/tools/rsaver.html Распакуйте его на один из дисков рабочей системы. Запустите. Если серьёзных повреждений нет, то Р.сэйвер реконструирует и восстановит RAID автоматически. После этого копируйте данные.

"диски с большой выработкой по времени"
Этот статус из проприетарной утилиты мало что говорит, но после подключения и до использования R.saver, вы можете проверить SMART каждого диска в R.tester'е: https://rlab.ru/tools/rtester.html

Это неплохо было бы сделать для успокоения совести, тем более СМАРТ можно посмотреть и для SCSI и SAS-дисков. Если там нехорошо, то дальше пока ничего не делайте, а выложите скриншоты.

Стоит ли пытаться оживить в сервисе четвёртый диск?
Да, это может потребоваться, в зависимости от содержимого живых дисков после попыток самостоятельного восстановления. Именно поэтому вам стоит отложить полетевший диск в сторону и никак его "не мучать".

Не знаю где вы территориально, так что вот универсальная памятка о том, к кому обращаться за восстановлением информации: https://xn----7sbbfbnfa0a2audfacc2cat8e9f.xn--p1ai/
Если вы в Москве, то будем рады помочь с массивом: https://rlab.ru/raidrecovery/

P.S.
CityCat4, спасибо, что упомянули! Ввиду работы в режиме военного времени, приходится прикладывать больше усилий к основным задачам, так что уже не особо получается как раньше сидеть с вами на уютненьком Тостере, мои дорогие :)
Ответ написан
Пригласить эксперта
Ответы на вопрос 3
@rPman
RAID должен был защитить от проблем на одном из дисков (при должном везении, raid10, на определенных двух), но не защитит от аппаратных проблем в самом устройстве, вполне возможно что накосячил уже сам рейд контроллер. Так же могут создать проблемы просто кабели или блок питания, создав каскадно ошибки сразу на всех дисках.

Потом дежурные помощники без понимания сути пытались восстановить загрузчик и похоже испортили его
при работе штатными средствами среда восстановления подключит системный диск в режиме записи и будет делать туда записи, когда то давно я это заметил еще на winxp, а главное правило при аппаратных проблемах с системами данных - ни в коем случае не писать на поврежденные диски!

Правильное действие, брать ВСЕ 4 диска и нести в сервис, лучше вместе с контроллером, параллельно покупать диск, на который поместятся твои данные, так как сервису понадобится куда то писать восстановленные данные. Не нужно пытаться даже просто включать диски, отличный пример - на диске откололась чешуйка материала и гуляет по диску оставляя все больше и больше новых бэд блоков, то же самое при определенной смерти контроллера, например он начнет пытаться читать и перезаписывать верные сектора (чтобы ремап произвести) просто при их чтении, аккуратно заменяя содержимое 0xFF

Ни в коем случае не пытайся чинить сам, не знание как это нужно делать, убьет данные эффективнее чем аппаратные проблемы.

p.s. на будущее, чтобы уменьшить себе проблем, не используй аппаратные контроллеры, обывателю достаточно софтварного raid благо технологий вагон и маленькая тележка как для win так и для linux
Ответ написан
CityCat4
@CityCat4
//COPY01 EXEC PGM=IEBGENER
Абра-швабра-кадабра, Zettabyte появись! Нужна консультация :)

В том, что в случае аппаратных проблем рейда (впрочем тут рейд фейковый, его роль играет проц) нужно немедленно прекратить писать в поврежденный массив, все остановить, все выключить и если сами не в состоянии - нести/звать сервис - rPman несомненно прав. В современных дисках такие нанотехнологии, что микроскопический отслоившийся кусочек Вам как наждаком по диску пройдет.

В сервис нужно нести все четыре диска. Причем желательно их пронумеровать - какой к какому порту был подключен (это аппаратный адаптек сам разберется и расставит их как надо, а софтрейд - фигу)
Ответ написан
Комментировать
@voleg4u
http://www.voleg.info/
Замени проводочки SATA, проверь что блок питания не подустал, замерь 5/12 В под нагрузкой всех 4 дисков.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы