Два раз в своей жизни сталкивался с проблемой отмирания одного из дисков в RAID-массиве на сервере. И оба раза обнаружение неполадок было слишком поздним, когда и второй падал.
Как говорится, дурак учится на своих ошибках. Объясните, пожалуйста, как и как часто нужно проверять целостность жестких дисков в софт рейде?
Cent OS, Hetzner.
в mdadm можно настроить оповещение по емайлу об отвалившемся диске, в заббиксе можно настроить проверку рейдов
в целом это все делает сисадмин на раз два.
Тут походу нужно пояснение =)
В /etc/mdadm/mdadm.conf прописать мыло для отправки почты, потом из командной строки выполнить
/usr/share/mdadm/checkarray --cron --all --quiet
Про программный написали, для аппаратных пользоваться родными утилитами управления и контроля, либо взять понравившуюся из этого списка hwraid.le-vert.net/wiki/DebianPackages потом хоть простым скриптом по крону дергаем раз в час, фильтруем состояние, если не ОК шлем мыло.