Здравствуйте.
Есть два компьютера, в которых по два SSD диска Samsung EVO 850 (500 гб) объединенных в программный RAID-1.
Один собран в начале 2015 года, работает всё работает до сих пор, параметр Wear_Leveling_Count на обоих дисках снижается синхронно, сейчас записано 89 тб, значения Wear_Leveling_Count на обоих дисках 29.
Второй собран в середине 2016 года и в работе одного диска есть странность. На оба диска записано по 50 тб (смотрю исходя из параметра Total_LBAs_Written), но на одном диске параметр Wear_Leveling_Count равен 72% (вполне нормальное значение), а на другом диске 41% (что ненормально).
Обратился в поддержку Samsung, там мне дали шаблонный ответ, даже не посмотрев данные SMART, что я отправил (ведь как писал ранее, исходя из данных того же SMART видно, что на диски записан одинаковый объем информации):
Разница значений в параметре зависит от построения RAID-массива. Например, в RAID1 параметр Wear_Leveling_Count может уменьшаться в случаях, когда накопителям нужна пересинхронизация: SSD 2 был неактивен и RAID должен будет перезаписать данные с SSD 1 на SSD 2, после его активации в системе.
Прошивки всех 4 дисков одинаковые, номера моделей совпадают.
RAID-1 используется для повышения надежности (диски выходят не только из-за исчерпания ресурсов, но и непредсказуемом выходе контроллера диска - личный опыт), поэтому, не надо писать, что это не имеет смысла в случае с SSD.
Подскажите, по какой причине может быть такое расхождение в параметрах Wear_Leveling_Count при одинаковом записанном объеме информации? Как определить, когда пора менять проблемный диск? Когда Wear_Leveling_Count будет подходить к 0 или же всё же смотреть по ресурсу записи, которое заявлет производитель (около 150 тб)? Может быть кто-то сталкивался, модели дисков популярные.
[~]# smartctl -A /dev/sda
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.10.0-327.36.3.el7.x86_64] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
9 Power_On_Hours 0x0032 098 098 000 Old_age Always - 7637
12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always - 17
177 Wear_Leveling_Count 0x0013 072 072 000 Pre-fail Always - 580
179 Used_Rsvd_Blk_Cnt_Tot 0x0013 100 100 010 Pre-fail Always - 0
181 Program_Fail_Cnt_Total 0x0032 100 100 010 Old_age Always - 0
182 Erase_Fail_Count_Total 0x0032 100 100 010 Old_age Always - 0
183 Runtime_Bad_Block 0x0013 100 100 010 Pre-fail Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0032 067 064 000 Old_age Always - 33
195 Hardware_ECC_Recovered 0x001a 200 200 000 Old_age Always - 0
199 UDMA_CRC_Error_Count 0x003e 100 100 000 Old_age Always - 0
235 Unknown_Attribute 0x0012 099 099 000 Old_age Always - 4
241 Total_LBAs_Written 0x0032 099 099 000 Old_age Always - 108741171263
[~]# smartctl -A /dev/sdb
smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.10.0-327.36.3.el7.x86_64] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
9 Power_On_Hours 0x0032 098 098 000 Old_age Always - 7637
12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always - 17
177 Wear_Leveling_Count 0x0013 041 041 000 Pre-fail Always - 1249
179 Used_Rsvd_Blk_Cnt_Tot 0x0013 100 100 010 Pre-fail Always - 0
181 Program_Fail_Cnt_Total 0x0032 100 100 010 Old_age Always - 0
182 Erase_Fail_Count_Total 0x0032 100 100 010 Old_age Always - 0
183 Runtime_Bad_Block 0x0013 100 100 010 Pre-fail Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0032 070 062 000 Old_age Always - 30
195 Hardware_ECC_Recovered 0x001a 200 200 000 Old_age Always - 0
199 UDMA_CRC_Error_Count 0x003e 100 100 000 Old_age Always - 0
235 Unknown_Attribute 0x0012 099 099 000 Old_age Always - 3
241 Total_LBAs_Written 0x0032 099 099 000 Old_age Always - 109374845811