Forum Linux.debian/ubuntu Smartmontools - SSD.

Posté par  . Licence CC By‑SA.
Étiquettes :
2
16
déc.
2014

Bonjour,

Voici mes données smartmontools pour mon SSD. Je ne comprends pas les erreurs…Par exemple, l'indication de "Power_on_Hours" est strictement beaucoup trop haute. :)

Est-ce qu'il y a un moyen de vérifier l'état des cellules d'un SSD ? Il paraît qu'on peut écrire environ 10 000 fois chacune d'elle…et j'aimerais préserver mes données si possible.

Je suis sous Debian Wheezy.
```
smartctl -a /dev/sda
smartctl 5.41 2011-06-09 r3365 x86_64-linux-3.14-0.bpo.1-amd64
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Device Model: INTEL SSDSC2CT060A3
Serial Number: CVMP247305FB060AGN
LU WWN Device Id: 5 001517 387ebfcf4
Firmware Version: 300i
User Capacity: 60 022 480 896 bytes [60,0 GB]
Sector Size: 512 bytes logical/physical
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: 8
ATA Standard is: ACS-2 revision 3
Local Time is: Tue Dec 16 19:44:05 2014 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 2097) seconds.
Offline data collection
capabilities: (0x7f) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Abort Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 48) minutes.
Conveyance self-test routine
recommended polling time: ( 2) minutes.
SCT capabilities: (0x0021) SCT Status supported.
SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
5 Reallocated_Sector_Ct 0x0032 100 100 000 Old_age Always - 0
9 Power_On_Hours 0x0032 000 000 000 Old_age Always - 101679056667940
12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always - 1092
181 Program_Fail_Cnt_Total 0x0032 000 000 000 Old_age Always - 0
182 Erase_Fail_Count_Total 0x0032 000 000 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 1080
225 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 208055
232 Available_Reservd_Space 0x0033 100 100 010 Pre-fail Always - 0
233 Media_Wearout_Indicator 0x0032 100 100 000 Old_age Always - 0
241 Total_LBAs_Written 0x0032 100 100 000 Old_age Always - 208055
242 Total_LBAs_Read 0x0032 100 100 000 Old_age Always - 200710
249 Unknown_Attribute 0x0013 100 100 000 Pre-fail Always - 5225

SMART Error Log not supported
SMART Self-test Log not supported
Note: selective self-test log revision number (0) not 1 implies that no selective self-test has ever been run
SMART Selective self-test log data structure revision number 0
Note: revision number not 1 implies that no selective self-test has ever been run
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
```

  • # Power_On_Hours_and_Msec

    Posté par  . Évalué à 2. Dernière modification le 16 décembre 2014 à 20:07.

    Déjà y'a un bug connu, c'est pas Power_On_Hours, mais Power_On_Hours_and_Msec sous l'attribut 9, d'où le mauvais calcul :
    http://sourceforge.net/p/smartmontools/mailman/message/32001790/

    Ensuite le reste des infos est suspect aussi, mais ça peut dépendre de l'utilisation.

    Il vient d'où ce SSD ? Si tu l'a eu neuf, déballé et installé direct Linux dessus sans jamais re-formater après, l'ext4 garde des traces du nombre total d'écritures.

    • [^] # Re: Power_On_Hours_and_Msec

      Posté par  . Évalué à 2. Dernière modification le 16 décembre 2014 à 20:58.

      Il a un an et demi à 8 heures par jour en moyenne (c'est vraiment une approximation !), j'ai réinstallé plusieurs fois Linux dessus (passant de Archlinux à Debian), mais cela fait bien 6 mois que je suis sous Wheezy.

      L'utilisation est assez basique.

      /etc/fstab

      # / was on /dev/sda1 during installation
      UUID=1da165ae-9268-49e1-922a-6d8a0e52b1cf /               ext4 noatime,discard,errors=remount-ro 0       1
      # /home was on /dev/sda2 during installation
      UUID=b2557934-e98d-4d05-9dd8-c8e20c4f2517 /home           ext4 noatime,discard,defaults        0       2
      

      Je dois avouer que je n'y comprends pas grand-chose. Autant, je m'en sortais bien avec les HDD, autant avec la technologie des SSD, j'ai un peu de mal à comprendre l'usure, comment la prévenir (limiter les écritures, certes), mais surtout, comment le diagnostiquer.

      Pour l'ext4, comment puis-je faire pour voir le nombre d'écritures ? :)

      • [^] # Re: Power_On_Hours_and_Msec

        Posté par  . Évalué à 2.

        Ben justement, si en croit les info SMART, ce SSD est quasiment neuf :

        • Une centaine de mo écrits, c'est bizarre.
        • Autant de lecture que d'écriture, c'est bizarre.
        • Autant de mise en veille que d'écritures…

        Soit la table SMART est buggée, soit smartmontool la gère mal (ça arrive), soit il faut l’interpréter différemment.

        Déjà regarde la commande proposé dans le lien que j'ai donné, smartctl -l devstat si elle fournie des informations plus pertinentes.

        Pour avoir la quantité de données écrite sur un fs ext4 :

        tune2fs -l /dev/sda1 | grep 'Lifetime writes:'

        Et tu recommence pour chaque partition.

        • [^] # Re: Power_On_Hours_and_Msec

          Posté par  . Évalué à 1.

          La commande devstat n'a pas l'air d'exister.

          =======> INVALID ARGUMENT TO -l: devstat
          =======> VALID ARGUMENTS ARE: error, selftest, selective, directory[,g|s], background, scttemp[sts|hist], scterc[,N,M], sasphy[,reset], sataphy[,reset], gplog,N[,RANGE], smartlog,N[,RANGE], xerror[,N][,error], xselftest[,N][,selftest    
          

          Et sinon :
          /dev/sda1 :Lifetimes writes : 930 GB
          /dev/sda2 : Lifetime writes: 1391 GB

          Le disque n'est vraiment pas neuf, je pense que smartmontool le gère mal.

          • [^] # Re: Power_On_Hours_and_Msec

            Posté par  . Évalué à 2. Dernière modification le 16 décembre 2014 à 22:48.

            Je pense aussi, y'a la version la plus récente dans les backports si tu veut tester https://packages.debian.org/wheezy-backports/utils/smartmontools

            Pour info j'ai mon SSD depuis deux ans en j'en suis à 221 re-écritures, soit à peu près 13to, j'ai donc de la marge.

            La méthode avec tune2fs me donne 7to d'écrit, mais j'ai re-installé aussi.

            • [^] # Re: Power_On_Hours_and_Msec

              Posté par  . Évalué à 1.

              Ah ! Ouep ! Ma version était trop vieille.

              #smartctl -l devstat

              Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org
              Device Statistics (GP Log 0x04)
              Page Offset Size Value Description
              1 ===== = = == General Statistics (rev 2) ==
              1 0x008 4 1099 Lifetime Power-On Resets
              1 0x010 4 7645 Power-on Hours
              1 0x018 6 13791837450 Logical Sectors Written
              1 0x028 6 13294872878 Logical Sectors Read
              4 ===== = = == General Errors Statistics (rev 1) ==
              4 0x008 4 0 Number of Reported Uncorrectable Errors
              4 0x010 4 18569 Resets Between Cmd Acceptance and Completion
              6 ===== = = == Transport Statistics (rev 1) ==
              6 0x008 4 18569 Number of Hardware Resets
              6 0x010 4 12682 Number of ASR Events
              6 0x018 4 0 Number of Interface CRC Errors
              7 ===== = = == Solid State Device Statistics (rev 1) ==
              7 0x008 1 255 Percentage Used Endurance Indicator

              En toute logique "mathématique", j'ai réécrit à peu près 7To, ce qui me fait pour un disque dur de 60Go 100 réécritures…J'ai de la marge aussi.
              Tu penses quoi de ces stats ?

              • [^] # Re: Power_On_Hours_and_Msec

                Posté par  . Évalué à 2.

                Je ne suis pas familier avec la sortie de devstat car mon SSD ne la supporte pas mais ça m'a l'air assez normal.

                Y'a toujours un rapport lecture/écriture qui me semble bizarre, mais vu que mon SSD ne supporte pas les stats en lecture non plus, je n'ai pas vraiment d'élément de comparaison.

                • [^] # Re: Power_On_Hours_and_Msec

                  Posté par  . Évalué à 1.

                  De toute façon, je n'ai pas à m'inquiéter. Des sauvegardes fréquentes suffisent et ma configuration a l'air correcte, au final, après 6 mois.

                  Je te remercie, tu m'as bien aidé ! :)

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.