Forum Linux.général Raid 5 et disques en veille

Posté par . Licence CC by-sa
4
15
oct.
2017

Bonjour

J'ai depuis peu un petit soucis avec le passage en mode veille des disques composant un raid 5 logiciel (mdadm)

J'utilise une mageia cauldron à jour (noyau 4.13.7) / plasma 5 en desktop

Depuis quelque temps (moins d'un mois), probablement suite à une mise à jour, les disques de mon raid 5 passent en veille et arrêtent donc de tourner alors même que j'utilise des données stockées dans le raid.
Typiquement, si je lis une vidéo, après 5 minutes, cela va saccader car un ou plusieurs disques sont dans un état standby. Cela arrive aussi alors qu'un processus écrit aussi sur le disque.

[root@hyperion ~]# hdparm -C /dev/sd[acde]
/dev/sda:
 drive state is:  active/idle
/dev/sdc:
 drive state is:  standby
/dev/sdd:
 drive state is:  standby
/dev/sde:
 drive state is:  standby

Utilisant la cauldron en rolling release, je n'ai donc pas trop moyen de savoir précisement depuis que le phénomène est apparu.

J'ai remarqué que si je suis actif ma session et que j'utilise mon clavier, je n'ai pas de problème de passage en veille.
Par contre, si je n'utilise que ma souris (typiquement dans mon navigateur) ou si je regarde une vidéo (pas d'action), les disques passent en stand by après 5 minutes.

Dès que je tape sur le clavier, j'entends les disques repartir.

Le raid 5 est composé de 4 disques Seagate 2.5"

[root@hyperion ~]# hdparm -I /dev/sd[acde] | grep Model
        Model Number:       ST2000LM015-2E8174                      
        Model Number:       ST2000LM003 HN-M201RAD                  
        Model Number:       ST2000LM003 HN-M201RAD                  
        Model Number:       ST2000LM003 HN-M201RAD

Ils sont réglés sur un niveau pour se gérer eux même.

root@hyperion ~]#  hdparm -I /dev/sd[acde] | grep level
        Advanced power management level: 254
        Advanced power management level: 254
        Advanced power management level: 254
        Advanced power management level: 254

J'ai donc voulu forcé les disques à rester actifs ( hdparm -S 0 /dev/sd[acde] ) pour voir mais sans succès.

hdparm a également une option -Z pour les seagate ST3 (???) a priori pour des problèmes comme le mien (testé quand même, ne semble pas fonctionner)

 -Z     Disable the automatic power-saving function of certain Seagate drives (ST3xxx models?), to prevent them from idling/spinning-down at inconvenient times.

Bref, je n'ai plus trop de piste, c'est sûrement logiciel mais je ne sais pas où regarder.
En plus du temps de lag désagréable lors du redémarrage des disques, je suppose que cela risque de prématurément les user si je laisse faire.

Je vais probablement ouvrir un bug chez mageia (rien trouvé à ce sujet dans leur bug tracker), mais je me demandais si quelqu'un ici avait une piste ou ou solution à mon problème.

  • # màj firmware

    Posté par . Évalué à 2 (+0/-0).

    Bonjour,

    Déjà tu peux vérifier ici s'il y a des mises à jour de firmware pour tes disques : https://apps1.seagate.com/downloads/request.html

    • [^] # Re: màj firmware

      Posté par . Évalué à 2 (+0/-0).

      C'est une idée mais ça a fonctionné correctement pendant un bon moment, je penche donc plutôt pour une maj coté OS.

  • # desactiver la mise en veille quand tu regardes une video

    Posté par . Évalué à 2 (+0/-0).

    suffit surement de dire à ton player video de desactiver la mise en veille

  • # Do you speak kernel ?

    Posté par . Évalué à 2 (+0/-0).

    Ecriture dans /var/log/syslog juste avant l'arrêt des disques (plus de bruit de rotation)

    Oct 16 21:47:10 hyperion kernel: [95404.260585] ata1.00: configured for UDMA/133
    Oct 16 21:47:10 hyperion kernel: [95404.260587] ata1: EH complete
    Oct 16 21:47:10 hyperion kernel: [95404.274108] sd 0:0:0:0: [sda] Write cache: disabled, read cache: enabled, doesn't support DPO or FUA
    Oct 16 21:47:10 hyperion kernel: [95404.286774] ata2.00: supports DRM functions and may not be fully accessible
    Oct 16 21:47:10 hyperion kernel: [95404.287326] ata2.00: disabling queued TRIM support
    Oct 16 21:47:10 hyperion kernel: [95404.288932] ata2.00: supports DRM functions and may not be fully accessible
    Oct 16 21:47:10 hyperion kernel: [95404.289468] ata2.00: disabling queued TRIM support
    Oct 16 21:47:10 hyperion kernel: [95404.290775] ata2.00: configured for UDMA/133
    Oct 16 21:47:10 hyperion kernel: [95404.290776] ata2: EH complete
    Oct 16 21:47:10 hyperion kernel: [95404.305103] sd 1:0:0:0: [sdb] Write cache: disabled, read cache: enabled, doesn't support DPO or FUA
    Oct 16 21:47:10 hyperion kernel: [95404.393900] ata3.00: configured for UDMA/133
    Oct 16 21:47:10 hyperion kernel: [95404.393902] ata3: EH complete
    Oct 16 21:47:10 hyperion kernel: [95404.408113] sd 2:0:0:0: [sdc] Write cache: disabled, read cache: enabled, doesn't support DPO or FUA
    Oct 16 21:47:10 hyperion kernel: [95404.513159] ata4.00: configured for UDMA/133
    Oct 16 21:47:10 hyperion kernel: [95404.513161] ata4: EH complete
    Oct 16 21:47:10 hyperion kernel: [95404.527109] sd 3:0:0:0: [sdd] Write cache: disabled, read cache: enabled, doesn't support DPO or FUA
    Oct 16 21:47:10 hyperion kernel: [95404.625820] ata5.00: configured for UDMA/133
    Oct 16 21:47:10 hyperion kernel: [95404.625822] ata5: EH complete
    Oct 16 21:47:10 hyperion kernel: [95404.639628] EXT4-fs (sdb1): re-mounted. Opts: commit=600
    Oct 16 21:47:10 hyperion kernel: [95404.640130] sd 4:0:0:0: [sde] Write cache: disabled, read cache: enabled, doesn't support DPO or FUA
    Oct 16 21:47:10 hyperion kernel: [95404.642038] EXT4-fs (sdb2): re-mounted. Opts: commit=600
    Oct 16 21:47:10 hyperion kernel: [95404.643339] EXT4-fs (md0): re-mounted. Opts: commit=600
    

    Désactivation du cache d'écriture des disques apparemment et délai de commit pour le système de fichiers à 600 sec si je comprends bien (ou pas?) et remontage des disques.

    -> sdb1 et sdb2 sont mes partitions système et home sur un ssd hors du raid.
    Même punition : commit à 600 ?

    Ecriture dans /var/log/syslog après avoir taper une touche du clavier

    Oct 16 21:50:25 hyperion kernel: [95599.630270] ata1.00: configured for UDMA/133
    Oct 16 21:50:25 hyperion kernel: [95599.630273] ata1: EH complete
    Oct 16 21:50:25 hyperion kernel: [95599.644158] sd 0:0:0:0: [sda] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
    Oct 16 21:50:25 hyperion kernel: [95599.661116] ata2.00: supports DRM functions and may not be fully accessible
    Oct 16 21:50:25 hyperion kernel: [95599.661678] ata2.00: disabling queued TRIM support
    Oct 16 21:50:25 hyperion kernel: [95599.663236] ata2.00: supports DRM functions and may not be fully accessible
    Oct 16 21:50:25 hyperion kernel: [95599.663717] ata2.00: disabling queued TRIM support
    Oct 16 21:50:25 hyperion kernel: [95599.665005] ata2.00: configured for UDMA/133
    Oct 16 21:50:25 hyperion kernel: [95599.665006] ata2: EH complete
    Oct 16 21:50:25 hyperion kernel: [95599.680175] sd 1:0:0:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
    Oct 16 21:50:27 hyperion kernel: [95601.695259] ata3.00: configured for UDMA/133
    Oct 16 21:50:27 hyperion kernel: [95601.695262] ata3: EH complete
    Oct 16 21:50:27 hyperion kernel: [95601.710161] sd 2:0:0:0: [sdc] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
    Oct 16 21:50:30 hyperion kernel: [95603.762184] ata4.00: configured for UDMA/133
    Oct 16 21:50:30 hyperion kernel: [95603.762186] ata4: EH complete
    Oct 16 21:50:30 hyperion kernel: [95603.775188] sd 3:0:0:0: [sdd] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
    Oct 16 21:50:32 hyperion kernel: [95605.800637] ata5.00: configured for UDMA/133
    Oct 16 21:50:32 hyperion kernel: [95605.800639] ata5: EH complete
    Oct 16 21:50:32 hyperion kernel: [95605.812870] EXT4-fs (sdb1): re-mounted. Opts: commit=0
    Oct 16 21:50:32 hyperion kernel: [95605.814236] sd 4:0:0:0: [sde] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
    Oct 16 21:50:32 hyperion kernel: [95605.814668] EXT4-fs (sdb2): re-mounted. Opts: commit=0
    Oct 16 21:50:32 hyperion kernel: [95605.815829] EXT4-fs (md0): re-mounted. Opts: commit=0
    

    Retour du cache en écriture et du commit EXT4-fs à 0.

    Je n'y comprends pas grand chose… toutes les veilles coté DM (plasma5) sont sur off normalement.
    Je suppose que je paye le fait d'être en cauldron :)

  • # Tu as en fait un gros soucis

    Posté par (page perso) . Évalué à 3 (+1/-0).

    J'ai depuis peu un petit soucis avec le passage en mode veille des disques composant un raid 5 logiciel (mdadm)

    Vaudrait mieux s'occuper des gros soucis avant les petits : avoir un RAID5.
    https://www.thedatacave.com/raid-5-is-dead

    • [^] # Re: Tu as en fait un gros soucis

      Posté par . Évalué à 2 (+0/-0).

      Certes mais ça m'aide pas :)
      D'autant plus que j'ai l'impression que le RAID n'a rien à voir dans tout ça.

      Mais sinon, à en croire l'article éventuellement le raid 6 pourrait faire l'affaire en permettant un disque de plus HS.
      Par contre, on perd en place du fait de la double parité et c'est plus lent si j'ai bien compris.
      A priori, on peut passer du raid 5 au raid 6 facilement
      http://www.ewams.net/?date=2013/05/02&view=Converting_RAID5_to_RAID6_in_mdadm

      Ou alors c'est du plusieurs volumes de raid avec ZFS par dessus ? ça demande des moyens que je n'ai pas (matériel et financier) et cela restera lent à restaurer.

      Après, tout ce qui est stocké dessus n'est pas critique (sauf quelques trucs sauvegardés ailleurs), je minimise juste un peu la perte possible si un disque claque et le cas échéant, ça fera du ménage ;)

Envoyer un commentaire

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.