@alex_bel

Как понять по smartctl умер ли диск?

Есть диск Mushkin на 120гб. MKNSSDAT120GB-DX
Линукс загружается на нём только в консоль, кое-какие сообщения проскакивают, что невозможно записать что-то в лог, т.к. не хватает места. Естественно места много.
Открыл диск в smartmontools. Вывод ниже. В интернетах пишут что показатели могут отличаться от производителя к производителю, и что даже если параметр ушел в ноль, то это не факт что диск умер.

1. Подскажите, как интерпретировать параметры в моём выводе, на какой атрибут смотреть?
2. Диску 2.5 года. Нормальный ли это период жизни для ssd?

smartctl 6.3 2014-07-26 r3976 [x86_64-linux-3.19.0-2-desktop] (SUSE RPM)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     MKNSSDAT120GB-DX
Serial Number:    MKN1249A0000147294
LU WWN Device Id: 0 000120 000000000
Firmware Version: 504ABBF0
User Capacity:    120,034,123,776 bytes [120 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ATA8-ACS, ACS-2 T13/2015-D revision 3
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Wed Feb 25 00:22:40 2015 EST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(    0) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 (  48) minutes.
Conveyance self-test routine
recommended polling time: 	 (   2) minutes.
SCT capabilities: 	       (0x0021)	SCT Status supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   100   100   050    Pre-fail  Always       -       4296042
  5 Reallocated_Sector_Ct   0x0033   100   100   003    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0032   086   086   000    Old_age   Always       -       12790 (218 18 0)
 12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       1530
171 Unknown_Attribute       0x0032   000   000   000    Old_age   Always       -       0
172 Unknown_Attribute       0x0032   000   000   000    Old_age   Always       -       0
174 Unknown_Attribute       0x0030   000   000   000    Old_age   Offline      -       91
177 Wear_Leveling_Count     0x0000   000   000   000    Old_age   Offline      -       4
181 Program_Fail_Cnt_Total  0x0032   000   000   000    Old_age   Always       -       0
182 Erase_Fail_Count_Total  0x0032   000   000   000    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
194 Temperature_Celsius     0x0022   038   071   000    Old_age   Always       -       38 (Min/Max 11/71)
195 Hardware_ECC_Recovered  0x001c   120   120   000    Old_age   Offline      -       4296042
196 Reallocated_Event_Count 0x0033   100   100   003    Pre-fail  Always       -       0
201 Unknown_SSD_Attribute   0x001c   120   120   000    Old_age   Offline      -       4296042
204 Soft_ECC_Correction     0x001c   120   120   000    Old_age   Offline      -       4296042
230 Unknown_SSD_Attribute   0x0013   100   100   000    Pre-fail  Always       -       100
231 Temperature_Celsius     0x0013   100   100   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0000   000   000   000    Old_age   Offline      -       9121
234 Unknown_Attribute       0x0032   000   000   000    Old_age   Always       -       5393
241 Total_LBAs_Written      0x0032   000   000   000    Old_age   Always       -       5393
242 Total_LBAs_Read         0x0032   000   000   000    Old_age   Always       -       2879

SMART Error Log not supported

SMART Self-test Log not supported

SMART Selective self-test log data structure revision number 0
Note: revision number not 1 implies that no selective self-test has ever been run
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
  • Вопрос задан
  • 4220 просмотров
Решения вопроса 1
В последнее время увы никак. У самого недавно несколько дисков посыпалось бэдблоками, хотя по SMART-у все в порядке было.
У вас скорее всего проблемы не в диске а в файловой системе. Попробуйте ее проверить
Ответ написан
Пригласить эксперта
Ответы на вопрос 2
Ernillew
@Ernillew
Администрирую *nix-системы с 1997 года
> что-то в лог, т.к. не хватает места. Естественно места много.

Скорее всего у вас какой-нибудь процесс держит большой удаленный файл. По df вы можете видеть, что место вроде есть, а места-то нет.

sudo lsof |grep deleted

посмотрите, может увидите жирного.
Ответ написан
Главное что бы значение VALUE не соответствовало TRESH в пунктах где TYPE = Pre-fail.

Но судя по тому, что у вас не определяется часть параметров вовсе - это уже плохо, по моему.
171 Unknown_Attribute       0x0032   000   000   000    Old_age   Always       -       0
172 Unknown_Attribute       0x0032   000   000   000    Old_age   Always       -       0
174 Unknown_Attribute       0x0030   000   000   000    Old_age   Offline      -       91
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы