@Supp0rt2019

Ошибка в логах с 3ware RAID, в чём может быть дело?

Всем привет.
Ломаю голову и не могу найти информацию по проблеме, вот и решил задать вопрос сюда.
Есть сервер который работает как "SAMBA-шара" на CentOS, в логах периодически начинает сыпаться ошибка по несколько раз в секунду:
Jan 21 08:14:19 localhost kernel: Descriptor sense data with sense descriptors (in hex):
Jan 21 08:14:19 localhost kernel:         7f 00 00 00 00 00 00 28 00 00 00 00 00 00 00 00 
Jan 21 08:14:19 localhost kernel:         00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 
Jan 21 08:14:19 localhost kernel:         00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 
Jan 21 08:14:23 localhost kernel: 3w-9xxx: scsi4: ERROR: (0x03:0x101A): Retry queued command:.
Jan 21 08:14:23 localhost kernel: sdd: <<DEFERRED>> [descriptor]: sense key: No Sense
Jan 21 08:14:23 localhost kernel:     Add. Sense: No additional sense information


Если перезагрузить сервер то, выплёвывает ошибку на счёт 3ware:
Jan 21 09:36:10 localhost kernel: 3w-9xxx: scsi4: AEN: ERROR (0x04:0x002A): Verify failed:unit=0.
Jan 21 09:36:10 localhost kernel: 3w-9xxx: scsi4: AEN: INFO (0x04:0x003D): Verify paused:unit=0.


Сегодня вообще зависла SAMBA и не получилось перезагрузить её, также не получалось убить процесс, помогла только жёсткая перезагрузка.
При этом диски через 3ware нормально определяются в системе.

Если выполнить команду tw_cli show, то выходит ошибка:
[root@filer ~]# tw_cli show

(0x0B:0x000A): Invalid drive ID


Ctl   Model        Ports   Drives   Units   NotOpt   RRate   VRate   BBU
------------------------------------------------------------------------
Ошибка сегментирования


Я так понимаю что проблема не в совсем корректной работе 3ware RAID контроллера, но что можно сделать я не могу понять. Если есть спецы в этом вопросе, я буду признателен вам за помощь.
  • Вопрос задан
  • 42 просмотра
Пригласить эксперта
Ответы на вопрос 1
Zettabyte
@Zettabyte
Специалист по восстановлению данных
Пункт №0: есть ли у вас проверенные на целостность бэкапы содержимого сервера? Без этого экспериментировать с системой я бы не стал, особенно в плане операций, подразумевающих запись.

У вас занятный вывод в том плане, что отображается Retry queued command:. без отображения команды. По идее там должно быть что-то наподобие 0x51.
Если судить по дампу, то проблема возникает с операцией чтения (read) - 28 M OM MM READ(10).

Было бы хорошо изучить что говорит мануал к вашему 3ware на этот счёт.

Кроме того, если бэкапы у вас есть и вдруг есть возможность загрузить Windows (например, с флешки), то запустите программу наподобие R.tester и посмотрите что она скажет про состояние дисков.

В первую очередь я проверил бы слот 27 (или 26). Если, конечно, такое количество дисков у вас вообще есть и моё предположение о том, что это нумерация, верное.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы