Kenny00
@Kenny00

Почему в mdadm RAID5 бьются файлы через промежуток времени а не сразу?

По предыдущему вопросу, думал проблема в диске, mdadm. (до этого делал чек массива, проблемы не выявлено, диск с бедами он не откинул)
Вынул диск который с бэдами, массив перешел в режим clean, degraded. Думаю если вставить диск рабочий , проблема не уйдет.
/dev/md127:
           Version : 1.2
     Creation Time : Mon Mar 16 21:27:21 2020
        Raid Level : raid5
        Array Size : 9743319040 (9291.95 GiB 9977.16 GB)
     Used Dev Size : 1948663808 (1858.39 GiB 1995.43 GB)
      Raid Devices : 6
     Total Devices : 5
       Persistence : Superblock is persistent

       Update Time : Thu May 27 12:25:01 2021
             State : clean, degraded
    Active Devices : 5
   Working Devices : 5
    Failed Devices : 0
     Spare Devices : 0

            Layout : left-symmetric
        Chunk Size : 64K

Consistency Policy : unknown

              Name : 33ea55f9:RAID-5-0  (local to host 33ea55f9)
              UUID : 04d214c4:ee331e6a:74ca0a04:5e846481
            Events : 468

    Number   Major   Minor   RaidDevice State
       -       0        0        0      removed
       1       8       19        1      active sync   /dev/sdb3
       2       8       35        2      active sync   /dev/sdc3
       3       8       51        3      active sync   /dev/sdd3
       4       8       67        4      active sync   /dev/sde3
       5       8       83        5      active sync   /dev/sdf3


Далее проверяю, создаю файл 1GB ровно, чекаю контрольную сумму md5 , жду минут 10, проверяю снова, файл битый... контрольная сумма не совпадает.

root@NAS-2:/RAID-5/srv1/# dd if=/dev/urandom of=Test.flie bs=64M count=32
dd: warning: partial read (33554431 bytes); suggest iflag=fullblock
0+32 records in
0+32 records out
1073741792 bytes (1.1 GB, 1.0 GiB) copied, 105.833 s, 10.1 MB/s

root@NAS-2:/RAID-5/srv1/# md5sum Test.flie
594eacb844ae053ab8bccadb9f3e43b4  Test.flie

root@NAS-2:/RAID-5/srv1/# md5sum Test.flie
522c8afffd428e14b425d31d8b5d7f52  Test.flie


btrfs check проблем не выявило.
правда cat /sys/block/md127/md/mismatch_cnt выдает 132567704

Куда копать?
  • Вопрос задан
  • 278 просмотров
Пригласить эксперта
Ответы на вопрос 2
@MechanID
Админ хостинг провайдера
в dmesg ошибки есть ? это может прояснить обстановку, если ошибок нет то
1 сделайте бекап данных
2 сделайте проверку с исправлением ошибок echo repair > /sys/block/mdХ/md/sync_action
3 повторите экспиримент с записью файла и сверкой чексумм
4 из известных мне экзотических странностей - если у вас центос и версия ядра 3.10.0-1160.15.2 или новее - попробуйте вернуться на ядро 3.10.0-1160.11.1 и повторите пункты 2 и 3
Ответ написан
@rPman
Проблемы могут быть не только в самой машине (например память битая, протестировать надо если есть возможность) но и на клиентском устройстве, чем/куда производишь копирование по сети

mdadm должен сыпать ошибки в dmesg или в первую консоль машины если есть повреждения, они дадут больше информации.
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы