Forum Linux.général Configuration RAID optimale pour 3 disques ?

Posté par (page perso) . Licence CC by-sa
Tags :
0
28
juin
2016

Bonjour,

Nous avons 3 disques identique de 4 To pour un serveur de fichiers "sécurisé". Nous souhaitons un maximum de sécurité vis-à-vis des défaillances matérielles. Chaque disque à été acheté chez un fournisseur différent. Nous ne souhaitons de pouvoir profiter que de 4 To, de sorte à favoriser la sécurité.

Quel configuration RAID sera optimale ?

En RAID 1, nous pourrions soit impliquer directement les 3 disques, ou n'en impliquer que 2 et placer le 3ème comme réserve (“spare”).

Je pense que les 3 directement impliqués sera plus sûr vis-à-vis de l'éventuel perte d'un deuxième disque lors d'une synchro' après qu'un premier disque tombe défaillant. Mais est-il possible de configurer la gestion RAID du noyau Linux de sorte à ce que l'un des 3 disques soit moins sollicité que les deux autres ?

Peut-on envisager un RAID 6 avec 3 disques ?!.

Merci d'avance.

  • # raid5

    Posté par . Évalué à 2.

    • [^] # Re: raid5

      Posté par (page perso) . Évalué à 1.

      Merci, surtout pour les autres lecteurs de cette discussion, car je connais bien cette article de Wikipédia.

      Par contre, j'aurais aimé avoir quelques avis avisés d'administrateurs systèmes (GNU/)Linux quant à savoir (considérant le noyau 3.16 et sa gestion logiciel du RAID) s'il vaut mieux :

      • RAID 1, 2 disques + 1 spare ;
      • RAID 1, 3 disques ;
      • RAID 6, 3 disques.

      Et aussi, concernant spécifiquement la gestion logiciel du noyau 3.16, s'il est possible de configurer finement de sorte qu'un disque soit moins sollicité que les autres, probablement en lecture ?

      • [^] # Re: raid5

        Posté par . Évalué à 2.

        Ne faut-il pas 4 disques, au minimum, pour faire du RAID6?

        • [^] # Re: raid5

          Posté par . Évalué à 2.

          Non, c'est bien 3 minimum. Un avec les données, les deux autres pour les parités. Bon dans l'absolu, ça ne sert à rien comparer à du raid1 mis à par à faire chauffer le CPU un peu plus.

          • [^] # Re: raid5

            Posté par . Évalué à 2.

            avec 3 disques, ca devient un raid5 non ?
            la parité etant repartit 1/3 sur chaque disque ?

            ici ca dit bien qu'il faut 4 disques mini pour faire un raid6
            https://en.wikipedia.org/wiki/RAID#Standard_levels

            mais en effet, il serait theoriquement possible de faire un raid6 avec 3 disques.
            DiskA,DiskB,DiskC
            data1,parité1,parité1
            parité2,data2,parité2
            parité3,parité3,data3

            mais ca me semble un beau gachi d'avoir 8To de parité pour 4To de données.
            là ou le raid5 serait suffisant et assure 8To de stockage pour 4To de parité.

            • [^] # Re: raid5

              Posté par . Évalué à 3.

              avec 3 disques, ca devient un raid5 non ?

              Non : avac un raid 5, tu as 1 seule parité (répartie sur les disque) Tu perds l'équivalent d'un disque

              Avec le RAID 6 tu as une double parité. Tu perds donc l'équivalent de 2 disques. Et le lien que tu donnes indique bien que "RAID 6 requires a minimum of four disks".

            • [^] # Re: raid5

              Posté par . Évalué à 3.

              mais en effet, il serait theoriquement possible de faire un raid6 avec 3 disques.
              DiskA,DiskB,DiskC
              data1,parité1,parité1
              parité2,data2,parité2
              parité3,parité3,data3

              Il faut plutôt écrire :
              DiskA,DiskB,DiskC
              data1,parité1n1,parité1n2
              parité2n2,data2,parité2n1
              parité3n1,parité3n2,data3

              Les parités de niveau 1 ne suit pas le même calcul de la parité de niveau 2 ( sans trop entrer dans les détails )

              Pire, il est possible de faire du raid1 avec du raid6, il suffit de prendre les bonnes parité.
              Si dataX+paritéXn1 doit être égale à 0, tu obtiens dataX = paritéXn1. Si tu d'arrange aussi pour que paritéXn2 = dataX. Tu obtiens dont dataX = paritéXn1 = paritéXn2 qui est ni plus ni moins qu'un raid 1 avec juste quelques calculs en plus. CQNSARAD.

      • [^] # Re: raid5

        Posté par . Évalué à -1.

        RAID 1, 2 disques + 1 spare ;
        RAID 1, 3 disques ;
        RAID 6, 3 disques.

        et je te renvoie sur la lecture de l'article de wikipedia.
        de tes 3 propositions seule celle là est realisable :
        RAID1 => 2 disques mirroirs + 1 spare eventuel

        les autres n'existent tout simplement pas,
        - un raid1 c'est un mirroir, donc tu ne peux pas faire un mirroir avec 3 disques.
        - un raid6, c'est un raid avec 2 disques de parité (checksum), mais dans ton cas, 2 disques de parité, c'est un seul disque de données, qui ne sera donc pas en raid, et c'est gaché 8To pour la parité, pour n'avoir que 4To de données.

        et donc on en revient au raid5
        3 disques, en raid5 => 8To de stockage + 4To de parité
        la parité est repartie sur les 3 disques, si un disque meurt, les deux autres peuvent fonctionner et reconstruire les données manquantes sur le remplacant du disque qui est en panne.

        • [^] # Re: raid5

          Posté par . Évalué à 3.

          • un raid1 c'est un mirroir, donc tu ne peux pas faire un mirroir avec 3 disques.

          Heu, tu devrais appliquer ton propre conseil et lire la section consacrée au RAID1:

          https://fr.wikipedia.org/wiki/RAID_(informatique)#RAID_1_:_Disques_en_miroir

          Il y est bien écrit

          Le RAID 1 consiste en l'utilisation de n disques redondants (avec n≥2), chaque disque de la grappe contenant à tout moment exactement les mêmes données, d'où l'utilisation du mot « miroir » (mirroring en anglais).
          

          Chaque disque contenant exactement les même données, tu peux bien entendu en faire autant de copie que tu veux.

          • [^] # Re: raid5

            Posté par . Évalué à 1.

            autant pour moi,
            je confesse mais un mirroir de 4To de data sur 2 autres disques de 4To (n=3)
            ca me semble etre gacher du stockage…

            • [^] # Re: raid5

              Posté par . Évalué à 4.

              … ou augmenter les chances de survie du volume.

            • [^] # Re: raid5

              Posté par . Évalué à 5.

              ca me semble etre gacher du stockage…

              Il faut comparer le coût d'indisponibilité de ton système durant la restauration par rapport au coût d'un disque. Et bien souvent, un disque ne coûte rien vis à vis des pertes liées à l'indispo du système.

  • # Raid 4 ou Raid 1

    Posté par (page perso) . Évalué à 0.

    Naturellement, on pourrait pencher vers du Raid 4 pour 3 disques identiques (cf. l'article Wikipedia pour les détails).

    Mais si on veut sécuriser les données et avoir un serveur un peu plus rapide, on peut avoir du Raid 1 pour les données et un disque sans Raid pour le système. Bien sur, cela implique qu'en cas de crash disque il faille reconstruire le système (réinstallation de Linux + ré-application des fichiers de configuration qu'on aura pris soin de sauvegarder).

    Sinon comme évoqué on peut monter juste un Raid 1 et garder le disque restant comme pièce de remplacement, mais je préférerais monter un Raid1 à 3 disques (plutôt que d'avoir un disque inutilisé). Après le vrai problème du Raid, c'est que souvent quand un disque lâche, les autres vont lâcher aussi juste derrière (c'est du moins ce que me disait un sysadmin d'un centre serveur) : car s'il y a un défaut sur un disque, vu que les autres disques sont souvent ses jumeaux (disques identiques achetées au même moment), il y a de grandes chances que les autres disques lâchent aussi (car ils ont le même défaut).

    Bon courage … et bon choix ! ;-)

    • [^] # Re: Raid 4 ou Raid 1

      Posté par (page perso) . Évalué à 1.

      Merci pour ta réponse.

      Comme je l'ai précisé, nous avons acheté chaque disque chez un fournisseur différent.

      Par contre, je cherche notamment à savoir si la gestion RAID logiciel du noyau permet (en lecture) de solliciter un des 3 disques moins que les autres ? (de sorte à réduire la probabilité d'usure "consécutive")

    • [^] # Re: Raid 4 ou Raid 1

      Posté par . Évalué à 2.

      Bien sur, cela implique qu'en cas de crash disque il faille reconstruire le système (réinstallation de Linux + ré-application des fichiers de configuration qu'on aura pris soin de sauvegarder).

      Dans ce cas ton RAID ne te sert à rien.

      Très important : un RAID n'est pas là pour la sauvegarde, mais pour la disponibilité. Autrement dit, un RAID ne te dispense pas de faire des sauvegardes régulières.

      Après le vrai problème du Raid, c'est que souvent quand un disque lâche, les autres vont lâcher aussi juste derrière (c'est du moins ce que me disait un sysadmin d'un centre serveur)

      Les sytèmes modernes peuvent te remonter des alertes lorsqu'un disque menace de lacher, donc tu peux anticiper le changement. Sinon, ce cas de figure est vrai pour des disques venant du même fournisseur. Mais pour régler ce genre de problème, tu peux acheter un disque de rechange identique dans 1 an, et remplacer un des anciens disque par ce nouveau disque (et faire la même chose tous les ans avec les autres disques). Tout dépend de ce que coute une indispo pour remettre en état ta machine.

      Sinon pour le raid4 par rapport au raid5 : le problème est que tu as ta parité sur un seul disque (contrairement au RAID 5 par exemple qui la répartit sur tous les disques). La conséquence est que si tu perds un disque de données, tu as une baisse de perf parce que le calcul de parité est systématique.

  • # RAID 1 ou RAID 5/6

    Posté par . Évalué à 4.

    Si tu veux pouvoir ajouter des disques par la suite tout en augmentant l'espace libre disponible, le RAID 6 me parait le mieux.

    Sinon un RAID 1 avec 3 disques, et pas de spare. Avec 4To le temps de reconstruction va être important, et la probabilité qu'un disque tombe en panne pendant la reconstruction est augmenté.
    Il est possible de réduire les lectures sur un des disques avec l'option --write-mostly de mdadm. (Même si j'ai surtout vu cette options utilisée pour des raisons de performances)

  • # Raid 5

    Posté par (page perso) . Évalué à 1.

    La solution retenu dépend du niveau de sécurité et ton niveau de performance souhaité.

    Je ne reviens sur les comparaisons du RAID5.
    Cependant l'utilisation du RAID 5 sur 3 disques, c'est que tu as potentiellement 3 fois plus de "bras" pour les perf.
    La solution RAID1, tu n'aura qu'un disque utile.
    La solution RAID6 est bonne pour les gros disques SATA mais il faut avoir un certain nombre de disques pour en bénéficier.

    Le plus intéressant est RAID5 plus 1 disque distant avec synchro en rsync toutes les nuits.

    • [^] # Re: Raid 5

      Posté par . Évalué à 3.

      le RAID1 est super efficace en lecture en cas de lectures concurrentes.

      En gros, la vitesse d'un disque en écriture et la vitesse en lecture de n disques si le nombre de lectures concurrentes et supérieur ou égal à n.

Suivre le flux des commentaires

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.