имеется сервер у хетзнера(debian wheezy), в нем 2 hdd 3tb
один из дисков не проходит длинный тест(smartctl --test=long /dev/sdb)
сектора не релокейтятся, до этого была та же проблема, я вывел винт из массива забил нулями и параметр 198 Offline_Uncorrectable стал равен 1, так он проработал более 3ех месяцев тесты проходили нормально, потом опять перестали проходить тесты, я опять вывел, забил нулями и параметр 198 Offline_Uncorrectable стал равен 0 и винт работал месяц нормально, мне нужно было остановить тест(рабочий день выпал на субботу и были небольшие тормоза), я запустил тест вечером и он не прошел
что смущает так это параметр 200 Multi_Zone_Error_Rate он меняет свое значение периодически
а) Винт не виден в системе. Причем желательно в начале проверить так же винт в rescue режиме - если не виден и там же, то все ок.
б) Винт провалил smart тест. Вот прямо так и написано - test failed.
в) На винте есть ошибки чтения. Их видно в выводе dmesg:
blk_update_request: I/O error, dev sda, sector 1937033224
Просто сделай
dmesg | egrep 'sda|sdb'
и если что-то покажет - значит у тебя диск умирает.
Деградация по Smart не является доказательством, что диск надо менять для Hetzner
aaalllsss: Нет, не видно, чтобы диск прямо умирал.
Можно попробовать протестировать его, но проблема в том, что тестирование ошибок записи на диск - это долго, нудно и убьет все твои данные.
Если нужно - могу рассказать как, но лучше не парится и сделать бекапы, конкретно сейчас проблем с диском не видно.
1. Следите за состоянием смарта ежедневно и ежедневно проводите long и short тесты.
2. Если у Вас seagate barracuda ( насколько помню, ставят именно их ) , то делайте ежедневно бекапы куда-нибудь наружу. У хецнера 3Тб сигейты умирают обычно сразу парами.
3. Загрузите в рескью и проверьте их софтом железо ( диски )