Deux analyses précieuses sur la fiabilité et la longévité des disques durs

Posté par  (site web personnel) . Modéré par Jaimé Ragnagna.
Étiquettes : aucune
1
21
fév.
2007
Matériel
Lors du 5th USENIX Conference on File and Storage Technologies (FAST '07) qui s'est déroulé du 12 au 16 février 2007 à San Jose (en Californie), deux passionnantes analyses statistiques sur la fiabilité des disques durs ont été présentées, par une équipe de chercheurs de Google d'un côté, et par une équipe de chercheurs de l'université Carnegie Mellon de l'autre.

Ces deux études ont étés élaborées à partir des données recueillies sur de très larges échantillons de disques (plus de 100 000 unités dans les deux cas) en condition d'utilisation réelle (ce ne sont pas des tests de laboratoire).
Ce sont les premières analyses publiées qui soient basées sur des échantillons de cette envergure.

Ces nouvelles études mettent à mal quelques idées reçues bien ancrées, par exemple :
  • Les températures de fonctionnement auparavant considérées comme trop élevées (40 - 45°C) ne sont pas un facteur de panne déterminant, par contre une température trop basse est très mauvaise pour les disques.
  • Les (très onéreux) disques SCSI et FC ne sont pas plus fiables que les disques SATA (bons marchés)
  • La « mortalité infantile » (le fait que les disques tombent en panne durant les premiers mois) n'est pas un phénomène significatif.
  • Les disques tombent souvent en panne sans que les données remontées par S.M.A.R.T. ne permettent de l'anticiper (mais lorsqu'un problème est remonté par S.M.A.R.T. le taux de panne dans les mois qui suivent augmente effectivement).
  • La probabilité pour que deux disques d'un même système / lot tombent en panne dans un laps de temps court (par exemple avant que l'array RAID soit reconstruit) est très importante.
  • Le taux d'activité des disques n'affecte pas significativement leur longévité

Mais des secrets de polichinelle ont été confirmés :
  • La fiabilité des disques varie selon les constructeurs (Google ne cite pas de noms)
  • La fiabilité des disques (MTTF/MTBF) indiquées officiellement par les constructeurs (par ex. 1 000 000 heures) sont très largement sur-évaluées.

Ainsi l'étude de Bianca Schroeder conduit à décrédibiliser le RAID5 dans son rôle d'agent critique pour la fiabilité du stockage, et à préconiser, en lieu et place du RAID5, et lorsque la fiabilité est cruciale, une double réplication des données. Google, dont l'infrastructure de stockage s'appuie sur le système de fichier distribué GFS et sur des disques SATA et PATA (plutôt que SCSI) semble confirmer par la pratique cette recommandation inédite.

Nous savons maintenant qu'un jeu de réplicats sur 3 disques durs SATA est plus fiable qu'un système RAID5 matériel en SCSI. Nous savions déjà que cette première option était bien meilleur marché. En outre, le contrôleur RAID physique est lui-même un point individuel de défaillance. Et surtout, les logiciels nécessaires (firmware (micro-code) de la carte, pilotes, outils de gestion à chaud (online management)) ajoutent leurs lots de bugs, d'autant plus critiques que les constructeurs se montrent réticent à rendre les spécifications et les listes de bugs des firmwares publiques.
Ces informations faciliteraient l'écriture, l'amélioration, l'audit, et la maintenance des pilotes pour les OS libres (par exemple : connaître en détail les bugs des diverses versions des firmwares permettrait aux pilotes de les contourner) ; elles permettraient l'écriture d'outils libres de gestion à chaud du contrôleur RAID matériel (outils qui nous font généralement cruellement défaut (pensez à Adaptec, par exemple)). L'attractivité des contrôleurs RAID matériels en environnement serveur est donc fortement remise en cause (du moins lorsque la fiabilité prime sur les performances), mais les fabricants de chipsets ont les cartes en main pour améliorer la situation pour l'ensemble des Unix libres (comme Linux, *BSD et OpenSolaris).

Notons que le 2007 Linux Storage & Filesystem Workshop s'est déroulé conjointement au FAST '07. Nous aurons certainement prochainement des informations sur les nouveaux enjeux et perspectives concernant l'évolution des systèmes de fichiers de Linux.

Aller plus loin

  • # .

    Posté par  (site web personnel) . Évalué à 7.

    La probabilité pour que deux disques d'un même système / lot tombent en panne dans un laps de temps court (par exemple avant que l'array RAID soit reconstruit) est très importante.

    Alors ça je confirme, il y a 2 ans j'ai repris la maintenance d'un serveur de fichiers qui comportait une douzaine de disques, dont 10 étaient de la même marque, même série (grave erreur). NEUF disques sont tombés en panne à quelques jours ou semaines d'intervalles...
    • [^] # Re: .

      Posté par  . Évalué à 4.

      moi, 2 disques à 1 heure d'intervalle et il fallait 1h30 pour reconstruire le disque de spare, pas de bol quoi.
      • [^] # Re: .

        Posté par  . Évalué à 7.

        Heureusement que tu avais des sauvegardes
        • [^] # Re: .

          Posté par  . Évalué à 8.

          oui on a tout récupéré dans les sauvegardes, c'était un grand moment inoubliable
      • [^] # Re: .

        Posté par  (site web personnel) . Évalué à 5.

        Tu n'aurait pas été victime d'un "effet avalanche", du fait que tu avais peut être 2 disques prêts à rendre l'âme (~ même niveau d'usure), et que la surcharge d'opération nécessitée par la reconstruction des données à fait claquer le deuxième ?

        Adhérer à l'April, ça vous tente ?

        • [^] # Re: .

          Posté par  . Évalué à 3.

          un des deux disques avait déjà eu un coup de chaud mais était retombé en marche mais la hotline ne change pas les disques qui remarchent (oui je sais, j'aurais pu lancer le disque contre un mur).
          • [^] # Re: .

            Posté par  . Évalué à 2.

            Ou surtout le changer préventivement, des données valent bien un nouveau disque dur, non ?
    • [^] # Re: .

      Posté par  (site web personnel) . Évalué à 1.

      Si on pense au même (purple) , c'est arrivé deux fois. Malgré mes recommendations, ils ont racheté une série de disques de la même marque: repanne (celle que tu mentionnes).

      "La liberté est à l'homme ce que les ailes sont à l'oiseau" Jean-Pierre Rosnay

      • [^] # Re: .

        Posté par  (site web personnel) . Évalué à 2.

        oui :)

        j'ai quand-même soupçonné les racks amovibles bas de gamme avec des connexions aléatoires, et des ventilateurs inefficaces. Une fois que j'ai tout viré et que j'ai mis les disques bien attachés sur des rails, branchés directement et avec un gros ventilo 12cm devant, il ne s'est plus rien passé. Leur seul problème depuis 1 an est que le serveur est plein ...
        • [^] # Re: .

          Posté par  (site web personnel) . Évalué à 2.

          D'après l'étude de Google (§ 3.4), l'augmentation de température n'augmente pas les pannes. Il vaut même mieux se situer entre 30 et 45 degrés: il y aurait plus de pannes aux basses températures.

          "La liberté est à l'homme ce que les ailes sont à l'oiseau" Jean-Pierre Rosnay

    • [^] # Re: .

      Posté par  . Évalué à 2.

      Je n'ai pas le temps de lire l'article, mais pour faire court : ça vient de quoi à votre avis ? (surtensions qui font griller plusieurs disques quasi en même temps ?)

      En parlant de la proba d'avoir 2 disques qui sautent dans un court laps de temps, que signifie "très importante" ? c'est dans quel ordre de grandeur ? (faut-il en conclure que le RAID5 ne sert à rien ?)

      (Au passage, il me semble que TuxFamily avait précisément eu ce genre de problème il y a qq années, non ?)
    • [^] # Re: Panne sur des serveurs différents avec des disques différents

      Posté par  . Évalué à 2.

      Êt si le système de fichier était en cause ?
      L'étude ne semble pas en parler.
      Pourtant, sur deux portables et une STB, j'ai eu des pannes sur à peu près les mêmes secteurs, passés 6 mois d'activité en 24x7.

      Oui, les disques en question étaient des 2,5", et oui, malgré les conclusions de l'étude, la température des disque était élevée.

      Il s'avère que les trois disques étaient en EXT3, et que c'est le secteur du journal qui a fait claquer les disques.
  • # RAID5

    Posté par  . Évalué à 10.

    Ainsi l'étude de Bianca Schroeder conduit à décrédibiliser le RAID5 […]

    Ah. Parce que le RAID5 avait encore de la crédibilité ?

    http://www.miracleas.com/BAARF/
    • [^] # Re: RAID5

      Posté par  . Évalué à 2.

      Oui, c'est vraiment hallucinant à quel point les mauvaises habitudes ont la vie dure.
      Le RAID 5 a eu son heure de gloire, à l'époque où les disques étaient hors de prix et les alternatives limitées.
      Aujourd'hui tout pousse à le fuir : mauvaises performances en écriture, surcoût sur les petites configs, extension de volume souvent impossible, etc.

      Et malgré ça, tous les revendeurs et mainteneurs à qui j'ai eu affaire proposent systématiquement des configs RAID 5 à leurs clients.
      Récemment je me suis engueulé sévèrement avec l'un d'eux qui a réussi à en refourguer une (config RAID 5) à une de nos agences dans mon dos, en dépit de mes instructions.
      Raison invoquée: il a appelé HP et ils lui ont dit que oui le RAID 5 c'est mieux [que le RAID 10].
      Il y a des jours comme ça j'aimerais bien que mon téléphone me permette davantage d'interactivité...
  • # Très bien cet article !

    Posté par  (site web personnel) . Évalué à 10.

    Avec une telle synthèse, les liens n'ont plus d'intérêt que pour les spécialistes. Moi, ça m'a fait gagner du temps. Merci.

    « J'ai pas Word, j'ai pas Windows, et j'ai pas la télé ! »

    • [^] # Re: Très bien cet article !

      Posté par  (site web personnel) . Évalué à 10.

      Oui d'ailleurs merci à l'auteur du journal que j'ai transformé en news et dont le nom n'apparait pas :/
      Il faudrait qu'on change ca pour avoir plus que le lien vers le journal quand un modérateur demande à transformer un journal en news. Parce que bon avoir mon nom alors que j'ai juste refait la mise en page, j'ai un peu l'impression d'être un voleur...
      • [^] # Re: Très bien cet article !

        Posté par  . Évalué à 10.

        Bah no pb, c'est un travail collectif de toutes façon (et puis je n'ai pas plus écrit les recherches de gogle/CMU, et c'est là le vai travail).
  • # Des nom! on veut des noms!

    Posté par  . Évalué à 5.

    La fiabilité des disques varie selon les constructeurs (Google ne cite pas de noms)

    Et quelqu'un a-t-il un lien sous la main détaillant la fiabilité des différents modèles et constructeurs?

    Je crois me rappeler qu'on avait Seagate puis Maxtor en tête de peloton, mais c'est par le facteur du cousin de ma boulangère que j'ai appris ça, j'ai donc des doutes sur la fiabilité et la fraîcheur de mes informations...
    • [^] # Re: Des nom! on veut des noms!

      Posté par  . Évalué à 5.

      Franchement je pense que la fiabilité des disques durs, c'est un peu comme la qualité des FAI, chacun à son avis la dessus et chacun aura son mouton noir. J'ai déjà vu des personnes qui critiquaient telles marques, et d'autres personnes d'autres marques, et au final, j'ai entendu tous les constructeurs traités de "constructeurs pourris". Un peu comme les FAI en France, quoi ...
      • [^] # Re: Des nom! on veut des noms!

        Posté par  (site web personnel) . Évalué à 5.

        Il ne faut surtout pas généraliser. J'ai eu 3 ou 4 pannes sur des Hitachi en peu de temps. Leur durée de vie se comptait en mois. Je suis persuadé que c'était une mauvaise série et je me garderais bien de généraliser. D'ailleurs, ils ont été échangés sous garantie.
        J'en utilise d'autres de même marque à la place, ils fonctionnent parfaitement. C'est pourquoi je me garderai bien de préconiser une marque ou une autre car toutes peuvent subir des aléas de fabrication.
        • [^] # Re: Des nom! on veut des noms!

          Posté par  . Évalué à 2.

          Mince, ton exemple tombe "mal", dans mon cas c'est deux IBM (le 2e était celui que j'ai eu en échange du premier ...) et un Hitashi. Sachant que la division disque dur d'IBM a été vendue à Hitashi. Ça fait beaucoup de coïncidences, mais ne généralisons pas. Non je ne généralise pas, allez, je me retiens .... gnnn .....
          • [^] # Re: Des nom! on veut des noms!

            Posté par  (site web personnel) . Évalué à 6.

            De toute façon, le HD est de loin le composant le moins fiable sur un PC, donc c'est normal que tout le monde ait des mésaventures un jour avec un HD. J'ai déjà cuit des Maxtor et Seagate, j'ai plein de pote qui ont grillé de l'IBM-Hitachi, et ça ne veut pas dire que tout ces constructeurs sont merdiques.

            De la même façon, je connais plein de gens qui ont un jour changé leur thermostat sur leur vielle voiture (sinon surchauffe moteur dès le moindre embouteillage), et ils ne se sont pas plaint que telle ou telle marque est à chier. Tout le monde sait que ce n'est pas fiable ces machins là.

            Adhérer à l'April, ça vous tente ?

            • [^] # Re: Des nom! on veut des noms!

              Posté par  (site web personnel) . Évalué à 0.

              Sauf qu'on ne stoque pas notre vie dans un thermostat :)
            • [^] # Re: Des nom! on veut des noms!

              Posté par  (site web personnel) . Évalué à 7.

              Le HD est de loin le composant le moins fiable sur un PC...

              C'est à voir, ils sont très fortement concurrencés par les lecteurs/graveurs de CD et de DVD. J'en ai une pile de six pas loin de moi sur laquelle sont posés 3 HD. Si j'ajoute les disques échangés sous garantie, je peux même dire qu'ils sont à peu près à égalité.

              Il y a un autre critère intéressant à prendre en compte : le prix.
              HD 5 Mo Apple ][ (~1981) : 5000F soit 150 000 ¤ le Go
              HD 32 Mo RLL (~1985) : 3200F soit 15 000 ¤ le Go
              HD 160 Go SATA (2007) : 54¤ soit 0.337 ¤ le Go
              On peut voir que stocker 1 Go de façon fiable est de plus en plus accessible.

              Pour les CD et DVD :
              Lecteur CD (2x) pour PC en 1990 : 8000 F soit 1200 ¤
              Graveur CD 4x en 2000 : 3000 F soit 450 ¤
              Graveur DVD en 2007 : 32 ¤

              Est que ces baisses de prix ont été préjudiciables à la fiabilité ?
              • [^] # Re: Des nom! on veut des noms!

                Posté par  . Évalué à 1.

                Même expérience. 9 ordinateurs à la maison dont 4 serveurs qui tournent 24/24 et 365/365. Les plus vieux disques durs tournent depuis (ma foi je sais plus mais si je vous dis que je les ai acheté neufs et qu'ils font 1,3Go ça vous donne une idée non ?).
                Bilan : zéro disque en panne aujourd'hui (j'ai bien quelques secteurs qui ont été mis de côté mais rien de plus grave).

                En revanche, j'ai déjà évacué 4 ou 5 lecteurs de CD (et un graveur) et j'en ai encore 2 qui pourrissent sur une étagère. Et je te rassure mes 4x et mes 8x ont rendu l'âme aussi. Ils n'étaient pas plus solides malgré leur prix.

                J'ai également eu 3 cartes graphiques grillées sans aucun overclocking. En général les cartes graphiques ont pété conjointement ou peu de temps après une panne de courant (toutes les bécanes ne sont pas ondulées).

                Je trouve donc que les DD sont loin d'être les éléments les plus fragiles, même si ces études montrent bien qu'ils le sont nettement plus que beaucoup de gens ne se l'imaginaient.

                Ceci étant, cette étude me console car je n'ai jamais eu les moyens de me payer du SCSI ni du RAID hard à titre perso. J'ai pratiqué le RAID soft à une époque et je préfère répliquer, actuellement, vu mes besoins perso qui ne sont pas ceux d'un provider en terme de continuité de service.
                En environnement pro, vu le prix actuel non seulement des disques (SATA) mais aussi des UC (et autres rack, lames), c'est sûr qu'un bon load balancing donne quand même la continuité de service attendue tout en offrant d'autres avantages par rapport au RAID.
                • [^] # Re: Des nom! on veut des noms!

                  Posté par  . Évalué à 1.

                  À noter que je crois avoir constaté au fil des années que les fumeurs usent les lecteurs optiques plus vite que les non fumeurs.
                  Ce n'est qu'une impression, je n'ai pas de chiffres, mais bon si tu fumes tu sais ce qui te reste à faire. :)
                  • [^] # Re: Des nom! on veut des noms!

                    Posté par  . Évalué à 2.

                    Ce n'est pas scientifique mais il est vrai que je suis non fumeur et que je n'ai jamais eu un seul problème avec des lecteurs/graveurs optiques, j'en ai des très vieux en stock qui fonctionnent parfaitement! Par contre j'ai eu des problème de disque dur...
                  • [^] # Re: Des nom! on veut des noms!

                    Posté par  . Évalué à 2.

                    Il suffit d'avoir vu quelques PC de fumeurs pour le comprendre (surtout les PC professionnels : on est moins soigneux quand ce n'est pas à soi) : tout jaunes, la poussière collée au goudron, et parfois quelques mégots…
                    • [^] # Re: Des nom! on veut des noms!

                      Posté par  . Évalué à 3.

                      Si on pousse jusqu'au bout la métaphore du "bureau", il manque l'icône "cendrier" sur l'écran :-)
                      Bon, encore que sur des CRT avec une dalle en verre, ça passe...

                      "Attention, êtes-vous sur de bien vouloir vider votre cendrier dans la corbeille ? Votre corbeille contient déja des documents et votre dernier mégot, déposé il y a 28 secondes n'est peut-être encore pas bien éteint..."
  • # Meilleur et moins cher que le RAID5 ?

    Posté par  . Évalué à 1.

    Nous savons maintenant qu'un jeu de réplicats sur 3 disques durs SATA est plus fiable qu'un système RAID5 matériel en SCSI. Nous savions déjà que cette première option était bien meilleur marché.


    Quelqu'un peut m'expliquer ça ? Je vois mal comment on peut faire moins cher que le RAID5 pour la même capacité de stockage.
    • [^] # Re: Meilleur et moins cher que le RAID5 ?

      Posté par  (site web personnel) . Évalué à 5.

      En comptant le prix du controleur qui fait le RAID 5 :)
      • [^] # Re: Meilleur et moins cher que le RAID5 ?

        Posté par  . Évalué à 4.

        Et en rajoutant la différence de prix des disques SCSI par rapport au SATA.
        • [^] # Re: Meilleur et moins cher que le RAID5 ?

          Posté par  . Évalué à 3.

          Oui donc pour du stockage perso pas hyper sollicité, un RAID 5 software avec des disques durs SATA achetés à des dates différentes et dans des magasins différents, ça reste le meilleur rapport capacité/prix/fiabilité ?
          • [^] # Re: Meilleur et moins cher que le RAID5 ?

            Posté par  (site web personnel) . Évalué à 4.

            Pas le raid5 -> raid1 ou le raid10.

            "La première sécurité est la liberté"

            • [^] # Re: Meilleur et moins cher que le RAID5 ?

              Posté par  . Évalué à 3.

              Ben on perd quand même N/2 disque pour la réplication non ? Alors qu'en RAID 5 c'est simplement N-1.
            • [^] # Re: Meilleur et moins cher que le RAID5 ?

              Posté par  . Évalué à 3.

              «Nous savons maintenant qu'un jeu de réplicats sur 3 disques durs SATA est plus fiable qu'un système RAID5 matériel en SCSI. Nous savions déjà que cette première option était bien meilleur marché.»

              Notre bonhomme n'a rien compris depuis le début.
              Bon je sais pas si c'est représentatif, mais on a des gammes de prix ici :
              http://materiel.net/browse_scsi.html
              http://materiel.net/browse.php <= et encore, y'a pas de RAID5.

              Moi je vois plutôt mal comment on peut faire plus cher, pour le prix d'un disque SCSI tu te paie plusieurs fois la capacité en SATA, plus de deux en tout cas.
              • [^] # Re: Meilleur et moins cher que le RAID5 ?

                Posté par  . Évalué à 0.

                Oui bon faut me lire aussi parce que ma question a un peu évolué par rapport au début :
                Oui donc pour du stockage perso pas hyper sollicité, un RAID 5 software avec des disques durs SATA achetés à des dates différentes et dans des magasins différents, ça reste le meilleur rapport capacité/prix/fiabilité ?


                Ma question demeure.
                • [^] # Re: Meilleur et moins cher que le RAID5 ?

                  Posté par  . Évalué à 1.


                  Oui donc pour du stockage perso pas hyper sollicité, un RAID 5 software avec des disques durs SATA achetés à des dates différentes et dans des magasins différents, ça reste le meilleur rapport capacité/prix/fiabilité ?


                  Non. cf le journal, la réponse de nicO et le lien posté par Sylvain Sauvage : http://www.miracleas.com/BAARF/

                  Même si tu prend des disques de marques/lots/fournisseurs différents, tu peux toujours perdre 2 disques en même temps. Donc raid1 ou mieux raid10 si tu as les moyens.
                  • [^] # Re: Meilleur et moins cher que le RAID5 ?

                    Posté par  (site web personnel) . Évalué à 3.

                    Même si tu prend des disques de marques/lots/fournisseurs différents, tu peux toujours perdre 2 disques en même temps. Donc raid1 ou mieux raid10 si tu as les moyens.

                    Ton argument contre le RAID5 est que tu peux toujours perdre 2 disques en même temps, n'est ce pas ? Et si tu as 2 disques en RAID1, ils ont autant de chance de lâcher, non ? :)
                    • [^] # Re: Meilleur et moins cher que le RAID5 ?

                      Posté par  (site web personnel) . Évalué à 3.

                      oui mais le raid5 est très sensible au erreur partiel. De plus, dans le cas d'un raid soft, il y a le problème d'un power off qui empèche d'avoir tous les disques à jour. Et dans ce cas, la gestion de la parité peut être cassé.

                      "La première sécurité est la liberté"

                    • [^] # Re: Meilleur et moins cher que le RAID5 ?

                      Posté par  (site web personnel) . Évalué à 3.

                      Je suis tout à fait d'accord, à partir du moment où tu as plusieurs disques dans la même tour, il y a une chance qu'ils explosent tous en même temps. RAID n'est pas un mécanisme de sauvegarde, qu'il soit RAID1 ou RAID5.

                      Cependant, pour un particulier qui sauvegarde ses données critiques (ses photos de vacances ?) sur disque externe ou DVD de temps en temps, l'utilisation d'un RAID5 avec par exemple 3 disques permet, pour un coût minime et des performances correctes, de s'assurer contre le lâchage d'un disque, non ?

                      Enfin c'est ce que je comptais installer dans mon PC sous peu, je ne vois pas ce qu'on peut faire de mieux : le but est de se prémunir contre 90% des problèmes (ne me dîtes pas que dans plus de 10% des cas, 2 disques lâchent en même temps) avec un petit surcoût, sachant que quoiqu'on fasse dans une tour le risque 0 n'existe pas.

                      Bref, condamner le RAID dans un environnement professionnel qui croit que ça équivaut à la sûreté absolue d'accord, mais comme une demi-assurance à bas-prix je ne vois pas le problème... C'est comme si on critiquait un particulier qui fait des sauvegardes une fois par semaine en lui expliquant que ça ne l'empêche pas de perdre le travail en cours : il le sait bien, mais il a juste cherché la solution maximisant les avantages par rapport à l'effort / prix.
                      • [^] # Re: Meilleur et moins cher que le RAID5 ?

                        Posté par  (site web personnel) . Évalué à 2.

                        D'après les articles, le raid5 est beaucoup moins fiable qu'un raid1. Il est très sensible au coupure de courant que peut foutre en l'air la gestion de la parité.

                        Vu le prix du Go, sauf si tu fais de la video amateur, un raid1 serait bien plus performant et avec un bien meilleur taux de sureté.

                        "La première sécurité est la liberté"

                        • [^] # Re: Meilleur et moins cher que le RAID5 ?

                          Posté par  (site web personnel) . Évalué à 4.

                          Je ne comprends pas bien : j'imagine qu'en cas de coupure de courant, le RAID5 peut avoir des problèmes à garantir l'intégrité des données parce qu'il écrit les informations de parité sur les différents disques, donc si une seule écriture n'est pas terminée il peut par la suite reconstruire les données de travers. Cependant, toujours dans l'optique de limiter les gros problèmes pour un particulier, si les erreurs arrivent seulement sur le bloc en écriture lors d'une panne de courant, ce n'est pas très grave (à moins que vous ayez une coupure de courant par jour)...

                          De plus pourquoi dis-tu que RAID1 est plus performant ? Avec un contrôleur hard correct, en lecture ça doit être strictement identique (et le RAID5 doit être plus rapide avec plus de 3 disques), et en écriture je crois effectivement que pour les petits accès c'est plus lent, mais ça doit dépendre de l'implémentation. Disons que si c'est la seule différence pour un prix nettement moindre, ça vaut toujours le coup.
                          • [^] # Re: Meilleur et moins cher que le RAID5 ?

                            Posté par  (site web personnel) . Évalué à 1.

                            Tous les réponses sont dans les liens plus haut.

                            "La première sécurité est la liberté"

                            • [^] # Re: Meilleur et moins cher que le RAID5 ?

                              Posté par  (site web personnel) . Évalué à 2.

                              Bah non, justement. J'ai tout lu, et les arguments contre le RAID5 ne s'appliquent pas à notre cas :

                              - Tous les exemples parlent d'environnements professionnels, de cas particuliers (serveur Oracle), et de haute résistance aux lâchages de disque, ce qui ne me concerne pas.
                              - Comparé au RAID10, les performances sont dégradées après la mort d'un disque et pendant la reconstruction. Et ?
                              - Les exemples pris concernent les arrays de 5-16 disques (qui peut raisonnablement mettre du RAID5 pour 16 disques ??), qui forcément exacerbent les risques et les défauts. Et c'est sans compter que certains partent du principe que les écritures se font disque après disque...
                              - La pénalité en écriture est largement détaillée, dans des articles datant d'avant 2000, en expliquant que la mémoire cache résoudrait le problème mais coûte trop cher. Ca tombe bien, j'ai 16 Mo de cache par disque. Vu que le problème n'arrive que pour les petites écritures, il me semble que justement dans la majorité des petites écritures chez moi (qui a dit bittorrent ?) on vient de lire le bloc donc on évite la moitié de la pénalité qui consiste à le relire, et le SATA2 qui regroupe et ré-ordonne les écritures évite l'autre moitié.
                              - Si un disque est en partie défectueux et qu'un autre lâche, d'autres blocs peuvent être invalides à la reconstruction. Le "autres blocs" est effectivement embêtant, mais j'espère que la majorité de mon disque n'est pas défectueux et que je ne reconstruis pas tous les jours. Avec moins de redondance j'ai plus de risques d'erreurs, c'est le compromis entre le RAID5 et le RAID10.
                              - Le risque de tout perdre est nettement plus élevé entre le RAID5 5 disques et le RAID10 8 disques (pour la même capacité de stockage). Forcément, avec 60% de disques en plus... Voir les points précédents.
                              - Certains articles soutiennent le RAID3 et 4, alors que d'autres les banissent à jamais...



                              Pour résumé, j'ai besoin d'une taille correcte de stockage bon marché, disons qu'aujourd'hui il est avantageux d'acheter 2 disques de 250 ou 320 Go. Je fais des sauvegardes une fois par semaine, mais j'aimerais un mécanisme automatique de sécurité au jour le jour. J'ai le choix entre :

                              - Laisser mes disques indépendants (ce que j'ai aujourd'hui), si l'un deux lâche je perds ce qu'il y a dessus mais pas sur l'autre.
                              - Les mettre en RAID0 pour plus de performance, mais j'ai plus de chances de tout perdre.
                              - Un disque de plus pour un RAID5 m'apporte des performances supplémentaires et une certaine sécurité si un jour un des 3 disques lâche.
                              - Deux disques de plus pour du RAID10, la solution la plus aboutie.


                              Si je faisais ça pour un serveur professionnel, bien sûr ces problématiques me concerneraient, mais passer de 3 à 4 disques chez moi pour utiliser du RAID10 au lieu du RAID5 n'est pas anodin : ni en prix, ni parce que je n'ai pas la place dans ma tour, ni pour une question de consommation et de chauffe, et pour l'instant je reste avec mon idée d'installer un RAID5.
                              • [^] # Re: Meilleur et moins cher que le RAID5 ?

                                Posté par  . Évalué à 1.

                                Mieux que le Raid 5, ca existe mais c'est plus cher: dans ma boite on utilise des serveurs de fichiers Network Appliance en RAID4 DP (double parité.)
                                La double parité permet de se protéger d'une panne rapprochée sur deux disques avant que le volume raid n'ait été reconstruit.
                                La machine reconstruit automatiquement le volume RAID en cas de problème, en utilisant un des 2 disques de spare disponibles dans chaque volume RAID
                                La machine détecte à l'avance qu'un disque va lacher et elle commande la pièce de rechange automatiquement.

                                Si les utilisateurs effacent par erreur un fichier ils peuvent aller dans le répertoire .snapshot et retrouver leurs fichiers tels qu'ils étaitent il y a une heure, deux heures... un jour, deux jours, ... une semaine, deux semaines..
                                Pas d'intervention du service informatique, pas de bandes à recharger !
                                La récupération est instantannée: les utilisateurs sont ravis.

                                C'est vrai que ca coute beaucoup plus cher qu'une baie raid 5 SCSI classique puisqu'il faut compter au moins 15.000 euros /To (+ le contrat de maintenance) mais au niveau de l'exploitation il n'y a pas photo. On se rattrape sur le temps passé: l'ingénieur système peut passer sur des problèmes plus intéressant que de gérer le stockage.

                                http://www.netapp.com/library/tr/3298.pdf
                          • [^] # Re: Meilleur et moins cher que le RAID5 ?

                            Posté par  . Évalué à 3.

                            Contrairement à ce que tu penses, je crois qu'une erreur d'écriture peut-être bien plus grave.

                            Si l'écriture touche les méta-données, alors cela peut détruire en grande partie ou complètement le système de fichier.

                            Ce que l'on reproche au RAID-5, c'est de ne pas être capable de faire ses écritures de façon atomique. Or comme il n'y a pas de somme de controle globale transverse à tous les disques, le système n'est pas capable de détecter de corruption lors d'une reconstruction.

                            Pour contourner ce problème, et là on sort du cadre d'un particulier; les fabriquant propose des cartes matérielles qui disposent de NVRAM ou de RAM et de batterie qui permet de conserver les données en cas de coupure de courant. Lorsque le courant revient, la carte écrit les blocs qu'elle n'a pas pu écrire avant la coupure sur les disques qui existent encore.

                            Comme c'est une carte matérielle, la structure de la matrice RAID-5 est propriétaire et il faut donc prévoir une carte de secours pour garantir de pouvoir remonter la matrice si la carte active meurt.

                            Encore un autre problème, évoqué par Theodore Ts'o ( par exemple en http://lkml.org/lkml/2005/6/27/298 mais je sais qu'il en a parlé lors de la conférence sur les FS en 2006, je ne retrouve plus le texte):
                            - Lors d'un transert DMA, les données sont copiées de la RAM vers le disque pour écriture. Le disque est fabriqué de façon a garantir une écriture de secteur atomique (ça ne fait que 512 octets).
                            - Lorsqu'il y a une coupure de courant, la tension chute à un niveau inacceptable pour la RAM (qui est très sensible) et son contenu est corrompu.
                            - Si la carte mère fait mal son boulot, et visiblement il y a beaucoup de cartes économiques qui ont ce défaut, elle ne détecte pas la chute de tension suffisement vite, et laisse le transfert DMA se faire vers le disque. Le disque n'ayant pas encore détecté la chute de tension écrit le secteur corrompu.

                            Hop, on a des données inutilisables sur le disque. Avec un journal on s'en sort si chaque evenement a une somme de controle. Sinon...
                            • [^] # Re: Meilleur et moins cher que le RAID5 ?

                              Posté par  (site web personnel) . Évalué à 1.

                              Merci pour ces précisions !

                              Effectivement, le problème de mauvaise reconstruction après des erreurs d'écriture peut être grave si on touche à des zones sensibles comme le système de fichiers (même si ça m'est déjà arrivé de restaurer des données sans le FS). Ceci-dit, j'essaie plutôt d'évaluer ce que le RAID5 me permet de gagner par rapport à du RAID0 : ce dernier n'aurait pas d'erreurs à la reconstruction, simplement parce qu'il n'y aurait pas de reconstruction ; quant aux erreurs d'écriture dans le système de fichier, ce dernier n'a pas plus de sommes de contrôle pour corriger.
                              Il y a donc des soucis, mais pas au point d'être un désavantage par rapport à aucune redondance.

                              Pour ce problème et celui de la sensibilité aux coupures de courant, est-ce que une multiprise "protection", une bonne alim et un système de fichiers comme ext3 peuvent aider ?
                • [^] # Re: Meilleur et moins cher que le RAID5 ?

                  Posté par  . Évalué à 2.

                  Pour du « stockage perso pas hyper sollicité » mais fiable on peut souvent se contenter de 3 disques ATA, dont le prix total sera inférieur à un seul disque SCSI.

                  Éventuellement sans RAID, par exemple en répliquant avec rsync ou unison toutes les x minutes, ou en RAID 1 logiciel + réplication asynchrone, ou, avec plus de disques, en RAID-Z2 (Zfs sous FUSE le permet-il ?) ou RAID 6, etc.
                  • [^] # Re: Meilleur et moins cher que le RAID5 ?

                    Posté par  (site web personnel) . Évalué à 3.

                    Oui, sauf en cas d'incident du genre rm -rf / qui sont répliqués sur tous les disques.
                    En cas de choc électrique, ou de feu, on peut aussi tuer tous les disques de la même machine. Une vraie sauvegarde doit toujours être stockée en un autre lieu.
              • [^] # Re: Meilleur et moins cher que le RAID5 ?

                Posté par  (site web personnel) . Évalué à 2.

                Hum, à vitesse de rotation égale, la différence est d'environ 3 sata pour le pris de 2 scsi (cas du 150Go et du 75Go à 10ktr/min)
                Cependant, les vitesses de rotations sont plus importantes en scsi (15ktr/min)
                • [^] # Re: Meilleur et moins cher que le RAID5 ?

                  Posté par  . Évalué à 1.

                  Hum, à vitesse de rotation égale, [...] Cependant, les vitesses de rotations sont plus importantes en scsi (15ktr/min)


                  Hum, y a pas un truc qui cloche dans ton message?
                  • [^] # Re: Meilleur et moins cher que le RAID5 ?

                    Posté par  (site web personnel) . Évalué à 2.

                    Non, si tu compares à vitesse de rotation égale (10ktr/min, la seule en commun) tu as les score que je donne.
                    Cependant ça monte plus haut en scsi, ou il y a des disques à 15ktrs/min, ce qui peut donc être un avantage du scsi (enfin d'après le liens donnés au dessus, j'ai pas fait le tour des constructeurs)
                    Désolé pour les élipses.
    • [^] # Re: Meilleur et moins cher que le RAID5 ?

      Posté par  . Évalué à 1.

      Il m'apparaît évident que le RAID n'est pas un mécanisme de sauvegarde fiable.

      Par contre, il me semblait que l'avantage des disques durs SCSI était qu'ils permettaient de changer un disque dur sans arrêter le serveur.

      Est-il possible d'en faire autant avec un disque dur SATA? J'imagine que si, mais je n'en ai jamais entendu parler.

      Si un des liens donne la réponse, ne pas taper.
  • # miam

    Posté par  . Évalué à -3.

    C'est article me fait b..... :°]

    Enfin bref, je suis tout RAIDe

    ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° >>||°<


    (pardon aux familles, tout çaa)
    • [^] # Re: miam

      Posté par  . Évalué à 0.

      ...et pour le coup, je m'autoflagelle pour l'énormité orthographique X_X

      Bonsoir à tous, et merci pour cet article très instructif.

      (Il aurait été intéressant d'avoir la fiabilité "statistique" par constructeur. D'expérience, les Maxtor sont d'une fiabilité assez navrante... mais font office d'excellentes bouillottes)
  • # A propos des marques

    Posté par  (site web personnel) . Évalué à 2.

    Je comprend que google ne cite pas de marque lorsqu'il parle de fiabilité.
    Mais nous ? avons nous des experiences significatives dans ce domaine ?

    J'ai eu une tres mauvaise serie de maxtor par exemple (sata), je parle d'une dizaine de disques, c'est pas aussi rationel que les test de google, mais j'en achete plus.

    et vous ?

    en vous remerciant
    • [^] # Re: A propos des marques

      Posté par  (site web personnel) . Évalué à 4.

      Comme je l'ai dit plus haut, on ne peut pas dire qu'une marque est meilleure qu'une autre. Ce qui est vrai à un moment ne l'est plus quelques temps plus tard. Toutefois tous les constructeurs peuvent avoir de mauvaises séries.
      Sachant qu'il y a moins d'usines de production que de marques (c'est comme pour les dalles LCD) il serait plus judicieux de s'intéresser au fabricant qu'à la marque.
      • [^] # Re: A propos des marques

        Posté par  . Évalué à 3.

        Sachant qu'il y a moins d'usines de production que de marques (c'est comme pour les dalles LCD) il serait plus judicieux de s'intéresser au fabricant qu'à la marque.

        Si je comprend bien, on est dans un cas proche de Procter & Gamble, qui fabrique 90% des lessives au travers d'une dizinae de marque ; donc fustigier une marque ne servirait à rien car la fabrication reste sous la tutelle du même groupe?

        Queluqu'n a-t-il une liste des fabricants de DD ? Quelqu'un s'y connait-il (plus que moi en tout cas)?
        • [^] # Re: A propos des marques

          Posté par  (site web personnel) . Évalué à 2.

          Il reste a savoir quel est le cahier des charges.
          En effet, tu a beau avoir un fabriquant identique, si le cahier des charges est différent cela peut jouer aussi, tant sur le prix que sur la qualité.
      • [^] # Re: A propos des marques

        Posté par  . Évalué à 5.

        En fait l'article de google dit précisément l'inverse : les produits de certains constructeurs sont nettement moins fiables. L'étude porte sur des disques SATA et PATA, de divers constructeurs, utilisés chez google depuis 5 ans, sur un très grand nombre de disques. Il est donc improbable que ce soit seulement du à une mauvaise série.

        Quand bien même les revendeurs de disques partageraient les mêmes usines, ils n'utilisent pas forcément les mêmes assemblages de composants, pas le même caisson (ce qui peut influer sur la température, les vibrations, etc.), pas forcément les mêmes marques de mémoire cache, de chipset PATA/SATA, ne paramètrent pas forcément le microcode de la même façon, n'ont pas forcément les mêmes tests de tests/validations avant mise sur le marché ... Et ils n'ont pas forcément le même réseau de transporteurs/logisticiens et n'emballent/empaquette pas forcément les disques de la même façon, ce qui semble influer sur la fiabilité selon ces deux sources :
        http://faq.storagereview.com/tiki-index.php?page=BrandMostRe(...)
        http://translate.google.com/translate?u=http%3A%2F%2Fpro.sun(...)

        Un simple assembleur de la rue montgallet, pour peu qu'il ai des stats sur les retours depuis plusieurs années, pourrait aussi nous donner des indications valables. Si l'un d'entre vous a des entrées dans le milieu...

        Sinon http://www.storagereview.com/ maintient un reliability survey dont on peut consulter les résultat (durée de vie telle qu'indiquée par les participants, constructeur par constructeur, modèle par modèle) lorsqu'on a participé (lorsqu'on indique l'état d'au moins un de ses disques). Je le consulte avant d'acheter mes disques (du coup, je n'achète pas les modèles dernier cris)...
    • [^] # Re: A propos des marques

      Posté par  (site web personnel) . Évalué à 0.

      Y a pas que la fiabilité intrinsèque, mais aussi le comportement du fabricant.
      Il y a qq années j'ai eu un WD400 qui m'a laché. J'ai pu récupérer le contenu, je l'ai envoyé en RMA en allemagne... et ils m'ont renvoyé un vieux ("refurbished" = recarossé). Bien sur le vieux ne dispose que de qq mois de garantie. Bien sur il faisait un bruit bizarre parfois... mais bon comme je ne m'en servais plus... et puis maintenant il se met à s'arreter tout seul... et il n'est plus sous garantie depuis longtemps. Résultat j'ai 40G qui ne peuvent servir à stoquer que des mp3. Et le WD800 que j'avais du prendre pour remplacer est assez capricieux aussi.
  • # Mortalité infantile

    Posté par  (site web personnel) . Évalué à 3.

    Que veut dire "La « mortalité infantile » (le fait que les disques tombent en panne durant les premiers mois) n'est pas un phénomène significatif." ?
    D'après l'étude de Google, on remarque par exemple que pour les disques durs soumis à une forte charge, il y en a environ 6 fois plus (2 fois plus sur l'ensemble du panel) qui meurent les 3 premiers mois qu'entre 6 et 12 mois, ça me paraît significatif...
    • [^] # Re: Mortalité infantile

      Posté par  . Évalué à 2.

      Exact, j'ai lu le papier de CMU en second et ne m'était pas aperçu sur le moment que les deux articles ont des conclusions opposées sur ce point. Peut-être que les méthodes d'approvisionnement (transporteurs, etc.) expliquent la différence entre les deux études sur ce point ?
      Par ailleurs l'étude de la CMU considère un disque comme défectueux lorsqu'il est remplacé : on peut supposer qu'un disque pas encore en prod (qui montre ses faiblesses dès l'installation) ne rentre pas dans cette catégorie et n'est pas comptabilisé.
      • [^] # Re: Mortalité infantile

        Posté par  (site web personnel) . Évalué à 2.

        http://www.usenix.org/events/fast07/tech/schroeder/schroeder(...)

        Tu as dû lire trop vite.

        "La première sécurité est la liberté"

        • [^] # Re: Mortalité infantile

          Posté par  . Évalué à 2.

          Comme quoi, on a tous du mal à lire correctement ;) :

          La figure que tu cite est un modèle antérieur basé sur un à priori/présupposé, extrait d'un papier de Jimmy Yang et Feng-Bin Sun ; elle ne présente pas les résultats des recherches de Schroeder & al. :

          « The common concern, that MTTFs do not capture infant mortality, has lead the International Disk drive Equipment and Materials Association (IDEMA) to propose a new standard for specifying disk drive reliability, based on the failure model depicted in Figure 2 [5,33]. ».

          Les graphes présentant les résultats de Schroeder & al. sur ce point sont plutôt ceux-ci : http://www.usenix.org/events/fast07/tech/schroeder/schroeder(...)

          Ce qui leur permet de dire dans le résumé : « We also find evidence, based on records of disk replacements in the field, that failure rate is not constant with age, and that, rather than a significant infant mortality effect, we see a significant early onset of wear-out degradation. ».

          Dans ce même sens, on trouve une (pré)étude intéressante menée par Mary Baker & al. en 2006 à l'Internet Archive, Disk Failure Investigations at the Internet Archive dans laquelle les auteurs indiquent : « Based on maintenance records, the Archive does not see systematic disk infant mortality. » (http://www.hpl.hp.com/personal/Mary_Baker/publications/wip.p(...) ).

          J'aurais du faire état de l'avis divergent de Google sur ce point. Cette divergence m'a échappé parce que google en parle très incidemment, tandis que Schroeder & al. en font grand cas, au point de mettre en valeur leur trouvaille concernant la « mortalité infantile » dans leur introduction et leur conclusion. Ayant lu ce papier en second ... paf !

          Cela dit, comme indiqué, Schroeder & al. parlent des pannes sur les disques en production (à vrai dire, c'est ce qui nous intéresse le plus), pas lors de l'installation ou la mise en place (le sens du mot failure diffère probablement de l'étude de Google) : « Any infant mortality failure caught in the manufacturing, system integration or installation testing are probably not recorded in production replacement logs. ». J'aurais donc du écrire : «La "mortalité infantile" [...] des disques en production n'est pas un phénomène significatif, selon Schroeder & al. ».

          Voilou.
  • # A propos des marques de disque dur, stat, SAV, fiabilité

    Posté par  . Évalué à 6.

    C'est pas tout à fait pertinent puisqu'il s'agit des retours SAV. On ne connaît pas tout à fait les raisons etc.

    Mais voici tout de même quelques liens vers:

    Taux de SAV des disques durs en 2006
    http://www.hardware.fr/news/7931/taux-sav-disques-durs.html

    - Western Digital : 1.02%
    - Hitachi : 1.16%
    - Maxtor : 1.44%
    - Seagate : 1.57%

    Taux de SAV des disques durs en 2003
    http://www.hardware.fr/news/5852/taux-sav-disques-durs.html

    Et tant qu'à faire, il y a aussi sur le même site:

    Taux de SAV des cartes mères:
    http://www.hardware.fr/news/8553/taux-sav-cartes-meres.html

    Taux de SAV des alimentations
    http://www.hardware.fr/news/7946/taux-sav-alimentations.html
  • # marque/modèle de disque dur différent

    Posté par  . Évalué à 2.

    Est-ce que le fait d'utiliser des disques durs de marque et/ou de modèle différent et donc ayant des caractéristiques/performances différentes ne pose pas des problèmes de synchronisation dans un système en raid 1?
    • [^] # Re: marque/modèle de disque dur différent

      Posté par  (site web personnel) . Évalué à 2.

      [ Contexte : « Software RAID » implémenté dans le driver md de Linux ]

      Pour répondre à la question, non. C'est même recommandé, afin de réduire la probabilité que les disques tombent en panne en même temps.

      Si les vitesses sont très différentes, je pense que c'est le disque le plus lent qui impose la sienne lors de l'écriture (dans les situations où le cache n'est pas suffisant pour masquer ce phénomène).

      Par contre, pour la lecture, il y une sorte de « load balancing » (cela dit, pas très optimisé selon le mainteneur de md) : chaque bloc de données demandé par un processus en espace utilisateur est lu sur un seul des disques, évidemment pas toujours le même (en particulier, il n'est pas comparé aux copies de ce bloc situées sur les autres disques ; si on veut les comparer pour être tranquille, chose à faire régulièrement, il y a une interface sysfs pour cela [echo check >/sys/block/md?/md/sync_action]).

      Bref, pour la lecture, en principe, avoir des disques de vitesses franchement différentes ne doit pas être très pénalisant ; par contre, je pense que ça l'est pour l'écriture.

      M'enfin, à moins d'avoir des besoins critiques en termes de performance disque, je n'y accorderais pas tellement d'importance. Pour la plupart de mes besoins, les performances actuelles des disques sont largement suffisantes ; je privilégie plutôt la fiabilité.
  • # argv(xxx)

    Posté par  . Évalué à 1.

    enfin des arguments.. fini la pouascaille et les enclumes

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.