Liens connexes

Dépêche modérée par

Dépêche éditée par

: Deux analyses précieuses sur la fiabilité et la longévité des disques durs

Posté par Pascal Terjan (Jabber id, page perso, ). Modéré le 21 février 2007.
0
Lors du 5th USENIX Conference on File and Storage Technologies (FAST '07) qui s'est déroulé du 12 au 16 février 2007 à San Jose (en Californie), deux passionnantes analyses statistiques sur la fiabilité des disques durs ont été présentées, par une équipe de chercheurs de Google d'un côté, et par une équipe de chercheurs de l'université Carnegie Mellon de l'autre.

Ces deux études ont étés élaborées à partir des données recueillies sur de très larges échantillons de disques (plus de 100 000 unités dans les deux cas) en condition d'utilisation réelle (ce ne sont pas des tests de laboratoire).
Ce sont les premières analyses publiées qui soient basées sur des échantillons de cette envergure.

> Lire la suite (76 commentaires, moyenne: 3).   [dépêche : 4634 caractères]


Ces nouvelles études mettent à mal quelques idées reçues bien ancrées, par exemple :

Mais des secrets de polichinelle ont été confirmés :
Ainsi l'étude de Bianca Schroeder conduit à décrédibiliser le RAID5 dans son rôle d'agent critique pour la fiabilité du stockage, et à préconiser, en lieu et place du RAID5, et lorsque la fiabilité est cruciale, une double réplication des données. Google, dont l'infrastructure de stockage s'appuie sur le système de fichier distribué GFS et sur des disques SATA et PATA (plutôt que SCSI) semble confirmer par la pratique cette recommandation inédite.

Nous savons maintenant qu'un jeu de réplicats sur 3 disques durs SATA est plus fiable qu'un système RAID5 matériel en SCSI. Nous savions déjà que cette première option était bien meilleur marché. En outre, le contrôleur RAID physique est lui-même un point individuel de défaillance. Et surtout, les logiciels nécessaires (firmware (micro-code) de la carte, pilotes, outils de gestion à chaud (online management)) ajoutent leurs lots de bugs, d'autant plus critiques que les constructeurs se montrent réticent à rendre les spécifications et les listes de bugs des firmwares publiques.
Ces informations faciliteraient l'écriture, l'amélioration, l'audit, et la maintenance des pilotes pour les OS libres (par exemple : connaître en détail les bugs des diverses versions des firmwares permettrait aux pilotes de les contourner) ; elles permettraient l'écriture d'outils libres de gestion à chaud du contrôleur RAID matériel (outils qui nous font généralement cruellement défaut (pensez à Adaptec, par exemple)). L'attractivité des contrôleurs RAID matériels en environnement serveur est donc fortement remise en cause (du moins lorsque la fiabilité prime sur les performances), mais les fabricants de chipsets ont les cartes en main pour améliorer la situation pour l'ensemble des Unix libres (comme Linux, *BSD et OpenSolaris).

Notons que le 2007 Linux Storage & Filesystem Workshop s'est déroulé conjointement au FAST '07. Nous aurons certainement prochainement des informations sur les nouveaux enjeux et perspectives concernant l'évolution des systèmes de fichiers de Linux.

Cette discussion est archivée, il n'est plus possible de laisser des commentaires.

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.

.

Posté par ccomb (Jabber id, page perso, ) le 21/02/2007 à 16:31. (lien). Évalué à 7.

La probabilité pour que deux disques d'un même système / lot tombent en panne dans un laps de temps court (par exemple avant que l'array RAID soit reconstruit) est très importante.

Alors ça je confirme, il y a 2 ans j'ai repris la maintenance d'un serveur de fichiers qui comportait une douzaine de disques, dont 10 étaient de la même marque, même série (grave erreur). NEUF disques sont tombés en panne à quelques jours ou semaines d'intervalles...

RAID5

Posté par Sylvain Sauvage () le 21/02/2007 à 16:38. (lien). Évalué à 10.

Ainsi l'étude de Bianca Schroeder conduit à décrédibiliser le RAID5 […]

Ah. Parce que le RAID5 avait encore de la crédibilité ?

http://www.miracleas.com/BAARF/

Très bien cet article !

Posté par Christophe Duparquet (page perso, ) le 21/02/2007 à 17:23. (lien). Évalué à 10.

Avec une telle synthèse, les liens n'ont plus d'intérêt que pour les spécialistes. Moi, ça m'a fait gagner du temps. Merci.

--
Christophe Duparquet
« J'ai pas Word, j'ai pas Windows, et j'ai pas la télé ! »

Des nom! on veut des noms!

Posté par calandoa () le 21/02/2007 à 18:16. (lien). Évalué à 5.

La fiabilité des disques varie selon les constructeurs (Google ne cite pas de noms)

Et quelqu'un a-t-il un lien sous la main détaillant la fiabilité des différents modèles et constructeurs?

Je crois me rappeler qu'on avait Seagate puis Maxtor en tête de peloton, mais c'est par le facteur du cousin de ma boulangère que j'ai appris ça, j'ai donc des doutes sur la fiabilité et la fraîcheur de mes informations...

Meilleur et moins cher que le RAID5 ?

Posté par Goon () le 21/02/2007 à 19:20. (lien). Évalué à 1.

Nous savons maintenant qu'un jeu de réplicats sur 3 disques durs SATA est plus fiable qu'un système RAID5 matériel en SCSI. Nous savions déjà que cette première option était bien meilleur marché.


Quelqu'un peut m'expliquer ça ? Je vois mal comment on peut faire moins cher que le RAID5 pour la même capacité de stockage.

[+] miam

Posté par phentex () le 21/02/2007 à 22:11. (lien). Évalué à -3.

C'est article me fait b..... :°]

Enfin bref, je suis tout RAIDe

° ° ° ° ° ° ° ° ° ° ° ° ° ° ° >>||°<


(pardon aux familles, tout çaa)

--
ggggnnnnnnnnnnnnnnnnn (interprétation libre)

A propos des marques

Posté par PloufPlouf (Jabber id, page perso, ) le 21/02/2007 à 22:26. (lien). Évalué à 2.

Je comprend que google ne cite pas de marque lorsqu'il parle de fiabilité.
Mais nous ? avons nous des experiences significatives dans ce domaine ?

J'ai eu une tres mauvaise serie de maxtor par exemple (sata), je parle d'une dizaine de disques, c'est pas aussi rationel que les test de google, mais j'en achete plus.

et vous ?

en vous remerciant

Mortalité infantile

Posté par François LEIBER (page perso, ) le 22/02/2007 à 09:04. (lien). Évalué à 3.

Que veut dire "La « mortalité infantile » (le fait que les disques tombent en panne durant les premiers mois) n'est pas un phénomène significatif." ?
D'après l'étude de Google, on remarque par exemple que pour les disques durs soumis à une forte charge, il y en a environ 6 fois plus (2 fois plus sur l'ensemble du panel) qui meurent les 3 premiers mois qu'entre 6 et 12 mois, ça me paraît significatif...

A propos des marques de disque dur, stat, SAV, fiabilité

Posté par Guillaume MANGEOT () le 22/02/2007 à 09:26. (lien). Évalué à 6.

C'est pas tout à fait pertinent puisqu'il s'agit des retours SAV. On ne connaît pas tout à fait les raisons etc.

Mais voici tout de même quelques liens vers:

Taux de SAV des disques durs en 2006
http://www.hardware.fr/news/7931/taux-sav-disques-durs.html


- Western Digital : 1.02%
- Hitachi : 1.16%
- Maxtor : 1.44%
- Seagate : 1.57%

Taux de SAV des disques durs en 2003
http://www.hardware.fr/news/5852/taux-sav-disques-durs.html

Et tant qu'à faire, il y a aussi sur le même site:

Taux de SAV des cartes mères:
http://www.hardware.fr/news/8553/taux-sav-cartes-meres.html

Taux de SAV des alimentations
http://www.hardware.fr/news/7946/taux-sav-alimentations.html

--
Gentoo-gnu/linux26 :: AMD :: Ion3
Qwerty s'excuse pour les fautes d'accents

marque/modèle de disque dur différent

Posté par Donk (Jabber id, ) le 22/02/2007 à 10:26. (lien). Évalué à 2.

Est-ce que le fait d'utiliser des disques durs de marque et/ou de modèle différent et donc ayant des caractéristiques/performances différentes ne pose pas des problèmes de synchronisation dans un système en raid 1?

--
JabberID: donk@jabber.fr

argv(xxx)

Posté par bandedepinpins2 () le 28/02/2007 à 16:23. (lien). Évalué à 1.

enfin des arguments.. fini la pouascaille et les enclumes

--
pinpins pinpins

Revenir en haut de page