Как проверить состояние SAS дисков на физическом сервере?
Здравствуйте.
Есть физический сервер, на нем установлены 2 SAS диска на 146 гб.
Самостоятельно нужно мониторить состояние дисков.
Решил использовать smartctl, но мне не совсем понятен вывод некоторой информации.
Проверкой здоровья вроде как показывает, что все норм:
smartctl -H /dev/sda
smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.19.0-13-amd64] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK
smartctl -H /dev/sdb
smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.19.0-13-amd64] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK
Но...
smartctl -a /dev/sda
smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.19.0-13-amd64] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Vendor: FUJITSU
Product: MBA3147RC
Revision: 0103
User Capacity: 147,086,327,808 bytes [147 GB]
Logical block size: 512 bytes
Rotation Rate: 15000 rpm
Logical Unit id: 0x500000e01b717ab0
Serial number: BJA0P8502D8M
Device type: disk
Transport protocol: SAS (SPL-3)
Local Time is: Sat Jun 5 09:40:29 2021 EDT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
Temperature Warning: Enabled
=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK
Current Drive Temperature: 28 C
Drive Trip Temperature: 65 C
Manufactured in week 21 of year 2008
Specified cycle count over device lifetime: 50000
Accumulated start-stop cycles: 32
Elements in grown defect list: 0
smartctl -a /dev/sdb
smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.19.0-13-amd64] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Vendor: FUJITSU
Product: MAX3147RC
Revision: 0104
User Capacity: 147,086,327,808 bytes [147 GB]
Logical block size: 512 bytes
Rotation Rate: 15000 rpm
Logical Unit id: 0x500000e0137d1e10
Serial number: DQ00P6B00K3R
Device type: disk
Transport protocol: SAS (SPL-3)
Local Time is: Sat Jun 5 09:41:34 2021 EDT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
Temperature Warning: Enabled
=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK
Current Drive Temperature: 26 C
Drive Trip Temperature: 65 C
Manufactured in week 47 of year 2006
Specified cycle count over device lifetime: 10000
Accumulated start-stop cycles: 36
Elements in grown defect list: 0
Пожалуйста, помогите расшифровать этот вывод. На что следует обращать внимание?
К примеру. За что отвечают:
Specified cycle count over device lifetime: 50000
Specified cycle count over device lifetime: 10000
Non-medium error count: 27
Non-medium error count: 83
При каких значениях вывода лучше проводить замену?
И почему не отображается сам SMART?
SMART не отображается, потому что вы его не попросили. Замену, если есть массив с избыточностью, обычно проводят, когда из него по серьёзным причинам (бывают и ложные срабатывания, хоть и относительно редко) выпадает один из дисков.