Forum Linux.debian/ubuntu Problème Multipath-tools

Posté par  .
Étiquettes : aucune
0
14
août
2009
Bonjour à tous,

Quelques soucis me gâchent la vie alors que je découvre le SAN et la Debian.

Voici ma conf:
2 serveurs X4240 SunFire ftp/http
2 serveurs X4440 SunFire BdD
1 Baie de stockage (2 contrôleurs) STK6140
2 switches SAN Bro300

Chaque serveur est en double attachement (2 HBAs par serveurs qui vont chacun sur 2 switches SANs, et qui rejoignent la baie de stockage sur chaque contrôleurs). Chaque serveur voit donc la baie par 2 paths différents.

Une société prestataire a installé et configuré le SAN, à ma charge l'OS (Debian Lenny adm64). Je précise que je ne fais pas de boot on SAN.

Ma façon de procéder:
- Installation de l'OS de base en débranchant les accès fibre (car sinon, ça ne semble pas marcher, pb au boot)
- Installation de multipath-tools et de ces dépendances

J'ai donc configuré mon multipath en prenant exemple sur ce qu'il se faisait sur le net, et voici l'état actuel des choses:

- Une foule d'erreur "end request : I/O error, dev sda, sector 0" sur la sortie
- multipath -ll donne:
sda: checker msg is "directio checker reports path is down"
dataftp_paths (3600a0b80005629c6000005da4a69747d) dm-6 SUN ,CSM200_R
[size=650G][features=1 queue_if_no_path][hwhandler=0]
\_ round-robin 0 [prio=0][enabled]
\_ 0:0:0:2 sda 8:0 [failed][faulty]
\_ round-robin 0 [prio=0][active]
\_ 3:0:0:2 sdd 8:48 [active][ready]

- Mes devices:
/dev/sda correspond à un path (il voit les 650Go du ftp)
/dev/sdb (20Mo) est a priori la LUN d'acces
/dev/sdc est le disque interne (en fait 2 disques de 73Go en RAID1)
/dev/sdc1 est /boot
/dev/sdc2 contient /usr, /home, etc. en lvm
/dev/sdd est le path qui est actif dans le multipath
/dev/sde (20Mo) est la 2e LUN d'acces
/dev/mapper/dataftp_paths est mon dm-6 qui pointe vers le bon path.
J'ai créé une partition en ext3 sur ce volume, qui m'a créé un /dev/mapper/dataftp_paths-part1.

J'avoue que je ne comprends pas trop ce qu'il se passe avec ce /dev/sda. Sur d'autres serveurs avec une config identique, même comportement (ce qui semble exclure une panne HW). Donc j'imagine que je fais une erreur, mais je ne vois pas laquelle. Ce qui est sûr, c'est qu'à l'installation, /dev/sda désignait mes disques de boot internes. J'ai modifié également le /etc/fstab comme ceci:

#
proc /proc proc defaults 0 0
/dev/mapper/fhtpntr2-root / ext3 errors=remount-ro 0 1
UUID=46e8b672-43f4-490c-9ffb-b276febe0602 /boot ext2 defaults 0 2
/dev/mapper/fhtpntr2-home /home ext3 defaults 0 2
/dev/mapper/fhtpntr2-tmp /tmp ext3 defaults 0 2
/dev/mapper/fhtpntr2-usr /usr ext3 defaults 0 2
/dev/mapper/fhtpntr2-var /var ext3 defaults 0 2
/dev/mapper/fhtpntr2-swap_1 none swap sw 0 0
/dev/mapper/dataftp_paths-part1 /dataftp ext3 defaults 0 2
/dev/scd0 /media/cdrom0 udf,iso9660 user,noauto 0 0


Si vous avez une petite idée pour me sortir de l'ornière, je suis preneur!

Merci par avance.

Xavier
  • # /etc/multipath.conf

    Posté par  (site web personnel) . Évalué à 2.

    La configuration de multipath se fait via le fichier /etc/multipath.conf
    Quelle est le contenu de ce fichier sur ce serveur?
    • [^] # Re: /etc/multipath.conf

      Posté par  . Évalué à 1.

      Un lien qui pourrait peut être t'aider :

      http://wiki.bolay.net/doku.php?id=operating_systems:linux:de(...)

      Ca parle de la configuration des multipath tools sur un serveur IBM ... A l'époque c'était pour Debian Etch je suppose, mais ça peut toujours te donner quelques pistes.
      • [^] # Re: /etc/multipath.conf

        Posté par  (site web personnel) . Évalué à 4.

        Le document original est de moi : http://www.tchetch.net/debian/multipath_ibm_ds4000 et il y a les changements entre etch et lenny là : http://www.tchetch.net/wiki/debian/maintenance/upgrade_to_le(...) ! En effet la configuration sur Etch ne fonctionne pas sur Lenny.
        Je penses que tu devrais déjà utiliser le "tur checker".
        Ensuite sur le document que j'ai fait il n'y pas les derniers détails de la configuration étant donné que j'ai fais des changements hier et que ça à l'air de mieux fonctionner encore, mais je vais documenter ça si ça fonctionne bien la semaine qui vient.

        "It was a bright cold day in April, and the clocks were striking thirteen" - Georges Orwell

        • [^] # Re: /etc/multipath.conf

          Posté par  . Évalué à 1.

          C'est toujours bon à savoir que tu as fait une update.
          Désolé pour le lien, j'espère que ça ne gêne pas le fait que je l'ai posté.
          Ton document m'a pas mal aidé, même si j'ai des lames JS21 et donc du PPC ... Installer debian est est un peu moins simple.

          J'espère qu'au moins ça pourra aider RobinX
          • [^] # Re: /etc/multipath.conf

            Posté par  (site web personnel) . Évalué à 2.

            Non, en fait l'histoire de se document est intéressant. Il a été publié en premier par Sylvain parce que je l'ai écrit lorsque je bossais chez un revendeur IBM. Du coups j'avais l'interdiction de le publier (RedHat et Suse ne pouvaient pas faire du multipath à ce moment là), par contre il m'avait demandé de l'envoyer à Sylvain qui l'a publié dans la semaine. Finalement pour pouvoir le publier moi, j'ai dû le prendre depuis le site à Sylvain parce que je n'avais pas accès au document original. Maintenant je travaille avec Sylvain ...

            Sinon je suis intéressé par les JS21, actuellement on a des lames intel, mais je penses que du PPC pourrait être plus intéressant pour certaines applications. Ça fonctionne bien ?

            Sinon j'ai installé du Debian sur des processeurs sparc, j'ai pas eu de problèmes particuliers.

            "It was a bright cold day in April, and the clocks were striking thirteen" - Georges Orwell

            • [^] # Lame JS21

              Posté par  . Évalué à 1.

              En fait, à l'époque ou j'ai eu l'occasion de tester, c'était Etch qui était en stable.
              On a des Lames HS20 et JS21.

              Sur les lames HS20, le problème était le fait que Debian voyait les disques du SAN en double. Ce soucis a été résolu par ton article, néanmoins de mémoire il fallait rebidouiller à chaque mise à jour du kernel.

              Sur les lames JS21 ça se corse ... Pour installer un OS, il faut passer en telnet ou ssh par le module management. Ce n'est pas super pratique.
              J'ai essayé plusieurs fois, mais à chaque fois l'installeur debian plantait ...

              Pressé par le temps on a du se résoudre à payer des licences redhat pour ces lames ...
              Après quelques mois d'utilisation, je peux juste dire que pour un habitué de Debian, Redhat, c'est vraiment vraiment très étrange. Grosso modo je n'aime pas. De plus j'ai l'impression qu'il y a moins de paquets pour PPC que pour i386 ou x86_64.
              • [^] # Re: Lame JS21

                Posté par  (site web personnel) . Évalué à 3.

                néanmoins de mémoire il fallait rebidouiller à chaque mise à jour du kernel.

                Tu avais modifier les fichiers de initramfs, car en effet si la modification n'était pas faites, chaque mise à jour du noyau posait problème, mais ça a été corrigé dans Lenny.

                Sinon pour l'installation sur les JS21, j'aimerais bien essayer ça, il doit bien avoir une solution. Sinon vous utilisez pourquoi les JS21 ?

                "It was a bright cold day in April, and the clocks were striking thirteen" - Georges Orwell

                • [^] # Re: Lame JS21

                  Posté par  . Évalué à 1.

                  Bon à savoir que ça a été corrigé dans lenny.

                  Pour les JS21, d'après le support IBM, rien à y faire. Eux de toute façon ils supportent redhat ou suse, point barre, si une autre distribution ne s'installe pas via le module management ... ils s'en fichent.

                  Les lames JS21 avaient été acheté à la base pour remplacer des serveurs qui tournaient sous AIX. Or moi et AIX on se connait que très peu, et je préfère Debian si possible.
                  Le compromis a été de prendre redhat ... pour garder le support IBM.
                  Sinon elles servent à faire du samba / nfs / apache / mysql / et forcément ... Tivoli Storage Manager ...

                  Donc au final l'impression que j'ai avec les JS21 est assez mitigée. Surtout que pour les mises à jour du kernel redhat et du pilote RDAC, il faut :
                  - faire la mise à jour du kernel
                  - reboot, et patienter ...
                  - désinstaller l'ancien pilote rdac
                  - recompiler le nouveau pilote rdac
                  - reboot à nouveau

                  C'est vraiment pas très pratique. Après il est fort possible que j'ai loupé des options ou que je n'ai pas l'expérience nécessaire pour utiliser correctement ce matériel, mais le temps pressant, je n'avais pas trop le choix.
                  • [^] # Re: Lame JS21

                    Posté par  (site web personnel) . Évalué à 2.

                    Pour les mises à jour RedHat ça ne m'étonne pas. J'ai jamais réussi à faire fonctionner ce RDAC et le support payant de RedHat nous avais répondu "c'est pas supporté". Donc c'est là que j'ai profiter pour introduire Debian auprès de mon patron. Boot on San avec support du multipath et tout, il a été séduit.

                    Sinon ouais, j'aimerais bien tester les lames JS21, mais cette année ça va pas être possible, mais je penses l'année prochaine je regardes pour avoir du ppc.

                    "It was a bright cold day in April, and the clocks were striking thirteen" - Georges Orwell

  • # San bien configuré ?

    Posté par  . Évalué à 2.

    Il y a un truc qui me chagrinne, d'apres ta conf si tous tes serveurs sont en double attachement, tu devrais avoir 4 chemins pour atteindre une LUN, pas 2.

    De plus, ton multipath -l indique clairement que tu as un chemin deffectueux.

    Au moins pour ca je pense que tu as un problème de zonning.
    • [^] # Re: San bien configuré ?

      Posté par  . Évalué à 1.

      Merci pour vos contributions.

      Voici le contenu de mon /etc/multipath.conf

      ##
      ## This is a template multipath-tools configuration file
      ## Uncomment the lines relevent to your environment
      ##
      defaults {
      # udev_dir /dev
      # polling_interval 10
      # selector "round-robin 0"
      # path_grouping_policy multibus
      # getuid_callout "/lib/udev/scsi_id -g -u -s /block/%n"
      prio_callout /bin/true
      # path_checker directio
      # rr_min_io 100
      # rr_weight priorities
      # failback immediate
      # no_path_retry fail
      user_friendly_names yes
      }
      blacklist {
      wwid 3600a0b80005630440000052849bb294d
      devnode "^(ram|raw|loop|fd|md|dm-|sr|scd|st)[0-9]*"
      devnode "^hd[a-z][[0-9]*]"
      devnode "^cciss!c[0-9]d[0-9]*[p[0-9]*]"
      device {
      vendor LSILOGIC
      }
      }

      multipaths {
      multipath {
      wwid 3600a0b80005629c6000005da4a69747d
      alias dataftp_paths
      # path_grouping_policy failover
      # path_checker directio
      # path_selector "round-robin 0"
      # failback manual
      # rr_weight priorities
      # no_path_retry 5
      # rr_min_io 100
      }
      }
      devices {
      device {
      vendor "SUN"
      product "CSM200_R"
      path_grouping_policy failover
      # getuid_callout "/lib/udev/scsi_id -g -u -d /dev/%n"
      path_checker directio
      path_selector "round-robin 0"
      hardware_handler "0"
      failback 15
      rr_weight priorities
      no_path_retry queue
      rr_min_io 100
      # product_blacklist LUN_Z
      }
      }

      Comme vous le voyez sans doute, je procède à tâtons car certaines des options de ce fichier ne me parlent pas trop.

      Pour rappel, chaque serveur est en double attachement
      (HBA1-Switch SAN 1-Baie disques CtrlA)
      (HBA2-Switch SAN 2-Baie disques CtrlB)

      Donc si je comprends bien, je devrais seulement avoir 2 paths gérés dans le multipath.

      Actuellement, j'ai en effet un des 2 paths qui est en échec, mais cela doit avoir un lien avec le fait qu'il soit repéré au démarrage en /dev/sda, non?

      J'essaie de faire les quelques modifs que vous m'avez d'ores et déjà indiquées.

      Xavier
      • [^] # Re: San bien configuré ?

        Posté par  . Évalué à 1.

        En postant mon dernier message avec le fichier de conf /etc/multipath.conf, je me suis aperçu que j'avais bêtement commenté toutes les lignes default_getuid_callout... Je suis également passé en tur checker, même si je ne sais pas ce que ça implique!

        Après un redémarrage du démon, et même du serveur, voici mon multipath -ll

        fhtpntr2:~# multipath -ll
        dataftp_paths (3600a0b80005629c6000005da4a69747d) dm-6 SUN ,CSM200_R
        [size=650G][features=1 queue_if_no_path][hwhandler=0]
        \_ round-robin 0 [prio=0][enabled]
        \_ 0:0:0:2 sda 8:0 [active][ready]
        \_ round-robin 0 [prio=0][enabled]
        \_ 1:0:0:2 sdc 8:32 [active][ready]


        Vous conviendrez que c'est mieux.

        Cependant, il y a toujours un nombre important de message de I/O error sur /dev/sda au démarrage, même s'ils s'arrêtent par la suite (ce qui es nouveau).

        Est-ce normal?

        Dans tous les cas, merci de vos différentes contributions (j'avais déjà marqué la page de Tchetch's dans mes favoris avant ce post), car elles permettent aux newbies comme moi de se débrouiller par eux-même (modulo les quelques boulettes inhérentes à ce type de profils). J'essaierai de faire la même chose à mon tour pour cette configuration.

        Xavier
      • [^] # Re: San bien configuré ?

        Posté par  . Évalué à 1.

        Si ton serveur n'est pas en production, as tu essayé de vider ton multipath.conf pour le laisser gérer ta conf en automatique histoire de voir si tu recuperes bien tes 4 chemins ?

        En revanche c'est normal que ta lun soit repérée entre autre par /dev/sda (elle devrait meme etre repérée en sda, sdb, sdc et sdd, les fameux 4 chemins), multipathd sert de couche d'abstraction par dessus ces devices et gère pour toi le fail over et le load balancing.

        Si tu peux essayer ca, ca permettra deja d'eliminer un problème de zonning sur tes switchs FC
        • [^] # Re: San bien configuré ?

          Posté par  . Évalué à 1.

          Les serveurs sont en configuration, pas en prod, donc je peux tester pas mal de choses. Cependant, je fais ces tests à distance.

          J'ai donc renommé le multipath.conf en ori, et j'ai relancé multipathd.

          Voici ce que donne un multipath -ll

          3600a0b80005630440000052849bb294ddm-8 SUN ,Universal Xpor
          [size=20M][features=0][hwhandler=0]
          \_ round-robin 0 [prio=1][enabled]
          \_ 0:0:0:31 sdb 8:16 [failed][ready]
          \_ round-robin 0 [prio=1][enabled]
          \_ 1:0:0:31 sdd 8:48 [failed][ready]
          sda: checker msg is "directio checker reports path is down"
          dataftp_paths (3600a0b80005629c6000005da4a69747d) dm-6 SUN ,CSM200_R
          [size=650G][features=0][hwhandler=0]
          \_ round-robin 0 [prio=0][enabled]
          \_ 0:0:0:2 sda 8:0 [failed][faulty]
          \_ round-robin 0 [prio=1][active]
          \_ 1:0:0:2 sdc 8:32 [active][ready]

          Cela s'accompagne bien sûr d'une flopée de I/O end request sur la sortie.
          Universal Xport (qui était filtré dans la blacklist) correspond au LUN d'access (20 Mo) et ne m'intéressent donc pas (même si elles accompagnent chaque path possible).

          Par contre, je ne comprends pas pourquoi tu mentionnes 4 chemins, chaque serveur ne voit la baie que par 2 chemins possibles.

          En remettant le bon multipath.conf et en redémarrant le démon, j'obtiens cette fois:

          fhtpntr2:/# multipath -ll
          dataftp_paths (3600a0b80005629c6000005da4a69747d) dm-6 SUN ,CSM200_R
          [size=650G][features=1 queue_if_no_path][hwhandler=0]
          \_ round-robin 0 [prio=0][enabled]
          \_ 0:0:0:2 sda 8:0 [active][ready]
          \_ round-robin 0 [prio=0][active]
          \_ 1:0:0:2 sdc 8:32 [active][ready]

          Cette fois, mon path par sdc est actif, contrairement à tout à l'heure où j'avais les 2 en enabled après mon reboot. D'ailleurs, le temps de faire quelques tests, je viens de m'apercevoir qu'ils étaient revenus en enabled tous deux...
          • [^] # Re: San bien configuré ?

            Posté par  . Évalué à 1.

            Non en fait une machine doit voir une lun 4 fois (chaque storage processor est connecté à chacun des switchs fiber, donc partant des switchs il y a 4 chemins possibles, à moins que les SAN SUN ne fonctionnent pas comme ca, en tout cas chez EMC et hp c'est le cas).

            Par contre multipath a effectivement des problèmes lorsqu'un chemin tombe, il a du mal a le remettre enable lorsque le problèmes est résolu (j'ai le meme soucis sur mes baies EMC)

            voila ce que donne un multipath -l chez moi (avec comme tu peux le voir un chemin marqué comme hs alors que ce n'est pas le cas)

            mpath0 (36006016059202100b095c7b34574dd11) dm-0 DGC,RAID 5
            [size=100G][features=1 queue_if_no_path][hwhandler=1 emc][rw]
            \_ round-robin 0 [prio=0][active]
            \_ 0:0:1:0 sdb 8:16 [failed][undef]
            \_ 1:0:1:0 sdd 8:48 [active][undef]
            \_ round-robin 0 [prio=0][enabled]
            \_ 0:0:0:0 sda 8:0 [active][undef]
            \_ 1:0:0:0 sdc 8:32 [active][undef]


            Par contre qu'entends tu par lun d'acces ? je suppose que c'est spécifique à sun parce que je n'ai jamais vu ca chez emc ou hp
            • [^] # Re: San bien configuré ?

              Posté par  . Évalué à 1.

              Pour ce que j'en sais, voici comment fonctionne le SAN avec les produits SUN que nous avons. Le hardware étant mis en place par une autre société, il est vrai que j'ai dû me fier à ce qu'ils m'ont dit.

              Sur chaque baie de stockage, il y a 2 contrôleurs (A et B).
              Sur chaque serveur, nous avons 2 HBAs (1 et 2).
              Il y a 2 switches SAN.

              Nous avons câblé 2 ensembles de fibres comme suit:
              HBA1--SAN1--CtrlA
              HBA2--SAN2--CtrlB

              Tout se passe donc comme si nous avions 2 paths pour accéder à la LUN présentée de la baie de stockage. Et multipath semble se comporter dans ce sens.

              LUN d'access, c'est le terme employé par la personne qui a installé la partie hardware. C'est un petit espace de 20Mo qui apparaît (un peu comme si je branchais une clé USB) dès qu'on branche un des paths (j'en vois donc 2 quand je branche mes 2 fibres). Je ne sais pas trop à quoi ils servent, aussi je les ai blacklistés dans le multipath.conf par leur WWN. Elles portent le nom de Universal Xport pour le multipath.

              Si j'ai bien compris, multipath a donc du mal à revenir sur un des paths lorsqu'il est de nouveau disponible? Cela se manifesterait chez moi avec le fait que mes 2 paths sont enabled, c'est ça?
              • [^] # Re: San bien configuré ?

                Posté par  . Évalué à 1.

                Ok, donc si je comprend bien, sur ton SAN, chaque storage processor (controleur A et B) n'a qu'un seul port fibre ? Si c'est le cas c'est normal que tu n'ais que 2 chemins.

                Si tu arretes multipathd, les 2 devices correspondant au path vers ta lun t'amenes bien sur la meme lun (si tu tentes de les monter ou de faire un fdisk dessus par exemple) ?

                Tu verras, le San en fait c'est simple et ca tourne pratiquement tout seul une fois que tu as compris la mecanique de l'ensemble, mais sans rigueur surtout au niveau du zonning, ca peut vite devenir cauchemardesque (comportements aléatoires)

                Pour tes chemins qui sont soit active ou enabled, c'est normal, ca te permet de savoir quel chemin est emprunté (active) et quels sont les chemins opérationels (enabled)
                • [^] # Re: San bien configuré ?

                  Posté par  . Évalué à 2.

                  Tout à fait, chaque contrôleur de la baie de stockage n'est relié finalement qu'à un seul HBA du serveur. Il est donc tout à fait normal de n'avoir que 2 paths.

                  Ce qui n'est pas bien normal par contre, c'est le comportement de mon path sur /dev/sda:

                  Exemple:

                  fdisk -l /dev/sda donne 6 messages d'erreur, et ne fait rien d'autre:
                  [6780.589677] end request : I/O error, dev sda, sector 0
                  [6780.589677] Buffer I/O error on device sda, logical block 0
                  [6781.338883] end request : I/O error, dev sda, sector 1363148792
                  [6781.338883] Buffer I/O error on device sda, logical block 170393599
                  [6782.451790] end request : I/O error, dev sda, sector 0
                  [6782.451790] Buffer I/O error on device sda, logical block 0

                  De nombreux messages du même type apparaissent au boot.

                  Ce qui est bizarre, c'est que le système voit qu'il y a quand même 650Go derrière, comme le prouve /proc/partitions par exemple:

                  fhtpntr2:~# more /proc/partitions
                  major minor #blocks name
                  8 0 681574400 sda
                  8 16 20480 sdb
                  8 32 71288832 sdc
                  8 33 248976 sdc1
                  8 34 71039430 sdc2
                  8 48 681574400 sdd
                  8 64 20480 sde
                  254 0 339968 dm-0
                  254 1 4882432 dm-1
                  254 2 2928640 dm-2
                  254 3 8261632 dm-3
                  254 4 389120 dm-4
                  254 5 54235136 dm-5
                  254 6 681574400 dm-6

                  Impossible de formater (cfdisk : Fatal Error: cannot read disk drive) ce /dev/sda.

                  En revanche, à côté de ça, /dev/sdd (ou /dev/sdc suivant son humeur) se comporte parfaitement, peut-être formaté, est accessible par fdisk, est visiblement mappé sous /dev/dm-6 avec multipath, peut-être mounté par sdc ou dm-6, etc. Si j'enlève le failback, multipath- ll donne le résultat suivant:

                  fhtpntr2:/dev# multipath -ll
                  dataftp_paths (3600a0b80005629c6000005da4a69747d) dm-6 SUN ,CSM200_R
                  [size=650G][features=1 queue_if_no_path][hwhandler=0]
                  \_ round-robin 0 [prio=0][enabled]
                  \_ 0:0:0:2 sda 8:0 [active][ready]
                  \_ round-robin 0 [prio=0][active]
                  \_ 3:0:0:2 sdd 8:48 [active][ready]

                  Cette sortie me plairait bien si je n'avais pas le comportement détaillé plus haut sur sda. Si je remets le failback, les 2 paths apparaissent enabled simultanément, même si je continue de pouvoir accéder à mes 650 Go...
                  • [^] # Re: San bien configuré ?

                    Posté par  . Évalué à 1.

                    ok, je sais que j'insiste mais je suis pratiquement sur que tu as un problème de zonning, ce n'est pas normal que sda ne contienne pas la meme chose que sdc ou sdd.

                    Peux tu regarder dans tes switchs fibre si tu as bien 2 zones par serveur ? (dans chaque zone tu dois avoir l'interface du controleur du san et la carte hba corespondante du serveur )
                    • [^] # Re: San bien configuré ?

                      Posté par  (site web personnel) . Évalué à 2.

                      Hello,

                      1) Etienne, désolé de t'avoir spolier ;-) et je veux bien entrer en matière pour du ppc.

                      2) Je confirme tout de fois les problèmes mentionnés au sujet de RH.

                      3) Qu'est-ce que c'est cette histoire de zonning??? Je n'ai jamais entendu parler de cela avec les SAN IBM?? Une petite explication serait la bienvenue.

                      Salutations,
                      Sylvain
                      • [^] # Re: San bien configuré ?

                        Posté par  . Évalué à 1.

                        Le zonning permet de matérialiser les chemins dans les fabric (définitions de zones entre WWN) .

                        Si tu ne sais pas ce qu'est un zonning, je doute que tu ais deja installé un san ...
                        • [^] # Re: San bien configuré ?

                          Posté par  . Évalué à 1.

                          Sur le SAN IBM que l'on a, j'ai bien un "Access" accessible par "Default Group". Il n'a pas de taille, je ne sais pas vraiment à quoi il sert non plus :/
                          Par contre, de mémoire il ne me semble pas que je le vois ou que je le voyais sur mes lames.

                          Pour le zonning, et le reste d'ailleurs j'ai l'impression de pas être le seul à avoir débarqué comme ça. Dans la plupart des cas, une société externe vient installer et configurer la machine, le san, puis il se barre, et voila ...

                          J'ai eu l'occasion de parler du zonning, et d'apprendre à quoi cela pouvait servir, lors de l'installation d'un deuxième "tape" pour TSM sur la baie. Pour une fois qu'un technicien prend le temps d'expliquer.
                          • [^] # Re: San bien configuré ?

                            Posté par  . Évalué à 2.

                            Oui je suis bien d'accord avec toi, surtout que beaucoup de personnes melangent san et nas et ne voient donc pas le besoin de formation qui va avec ...

                            Surtout que le zonning, une fois qu'il est fait, a moins d'ajouter un element ou de changer une carte hba, on en a pas besoin ...

                            Enfin, pour revenir au problème de RobinX, si les zones sont mals définies, ou pire, si une seule zone a été crée avec tous les WWN dedans (oui oui certains osent faire ca), ca peut sembler fonctionner en apparence mais provoquer des problèmes de ce type
                            • [^] # Re: San bien configuré ?

                              Posté par  . Évalué à 1.

                              Difficile à vérifier si le zonning est correct... Je ne suis pas sûr site (peut-être dans 2 semaines...). Il m'avait semblé que c'était assez logique ce qu'avait fait le technicien, je n'avais pas été surpris par sa configuration.

                              Maintenant, je l'ai suivi de loin, donc à voir... Mais je crains que le souci ne vienne pas de là...

                              Sinon, à titre personnel, vous choisiriez quoi entre RedHat et Debian pour cette conf (niveau rapport facilité de mise en place/coût).

                              Xavier
                              • [^] # Re: San bien configuré ?

                                Posté par  . Évalué à 1.

                                ok, oui c'est assez contraignant à vérifier, mais en tout cas sur les switchs brocade, si les alias ont bien été fait, il est facile de repérer une erreur via l'interface d'admin java.

                                Concernant la distrib à utiliser, honnetement, a partir du moment ou le support technique du SAN n'impose pas de distribution particuliere ou de blob proprio (merci EMC pour powerpath qui kernel panic si on a le malheur de faire les updates kernel redhat), prend la distribution ou tu es le plus à l'aise, les outils de multipathing sont disponibles partout.
                                • [^] # Re: San bien configuré ?

                                  Posté par  . Évalué à 1.

                                  Pour ce matériel, SUN ne supporte que RedHat, Suse, etc. Que les distributions payantes en somme.

                                  Cependant, comme tu le soulignes, les outils de multipathing semblent développés un peu partout. Quand on m'a présenté ce projet (dès que je suis arrivé en fait, en mai :), je ne connaissais pas Linux, mais HP-UX...

                                  Du coup, comme j'ai commencé à bosser sur Debian, je m'y sens forcément plus à l'aise :) Et puis le patron sera forcément plus content si je lui fais économiser les licences RH.

                                  Tiens, en faisant un apt-get upgrade, je suis tombé sur une série d'erreurs (que je n'ai pas eu le temps de noter) et qui impliquait le fichier /boot/grub/device.map. Si je regarde dedans, je vois ça:

                                  fhtpntr1:/# more /boot/grub/device.map
                                  (hd0) /dev/sda

                                  Intéressant, non? Pour l'installation, j'avais débranché toutes mes fibres, et seul mes disques internes étaient attachés. Que dois-je déduire de ce que me dit ce fichier?

                                  Xavier
                  • [^] # Re: San bien configuré ?

                    Posté par  (site web personnel) . Évalué à 2.

                    Tu peux poster ton fichier : /usr/share/initramfs/hooks/multipath_hook, ton fichier /etc/fstab et ton fichier /boot/grub/menu.lst

                    Ensuite device.map de grub doit faire référence pas à /dev/sda mais à /dev/mapper/ton_disque

                    Si tu utilises le multipath tu ne dois pas accèder via /dev/sdX, mais vraiment au disque dans /dev/mapper/* !

                    "It was a bright cold day in April, and the clocks were striking thirteen" - Georges Orwell

                    • [^] # Re: San bien configuré ?

                      Posté par  . Évalué à 1.

                      Pour rappel, je ne fais pas de boot on SAN, je boote uniquement sur mes 2 disques internes configurés en RAID1.

                      Pour les fichiers:

                      Pas de fichier /usr/share/initramfe/hooks/multipath_hook!

                      /etc/fstab:
                      # /etc/fstab: static file system information.
                      #
                      # <file system> <mount point>
                      proc /proc proc defaults 0 0
                      /dev/mapper/fhtpntr2-root / ext3 errors=remount-ro 0 1
                      UUID=46e8b672-43f4-490c-9ffb-b276febe0602 /boot ext2 defaults 0 2
                      /dev/mapper/fhtpntr2-home /home ext3 defaults 0 2
                      /dev/mapper/fhtpntr2-tmp /tmp ext3 defaults 0 2
                      /dev/mapper/fhtpntr2-usr /usr ext3 defaults 0 2
                      /dev/mapper/fhtpntr2-var /var ext3 defaults 0 2
                      /dev/mapper/fhtpntr2-swap_1 none swap sw 0 0
                      /dev/mapper/dataftp_paths-part1 /dataftp ext3 defaults 0 2
                      /dev/scd0 /media/cdrom0 udf,iso9660 user,noauto 0 0

                      Je monte le /boot par l'UUID du disque interne.
                      Je monte mon volume SAN sur /dataftp

                      Et le /boot/grub/menu.lst (je n'ai pas modifié les options par défaut)
                      title Debian GNU/Linux, kernel 2.6.26-2-amd64
                      root (hd0,0)
                      kernel /vmlinuz-2.6.26-2-amd64 root=/dev/mapper/fhtpntr2-root ro quiet
                      initrd /initrd.img-2.6.26-2-amd64

                      title Debian GNU/Linux, kernel 2.6.26-2-amd64 (single-user mode)
                      root (hd0,0)
                      kernel /vmlinuz-2.6.26-2-amd64 root=/dev/mapper/fhtpntr2-root ro single
                      initrd /initrd.img-2.6.26-2-amd64

                      En fait, dans ce fichier /boot/grub/device.map, plutôt que de voir /dev/sda, je me serais attendu à voir un chemin vers mes disques de boot internes (souvent en /dev/sdc, mais le mieux, c'est de prendre l'UUID).

                      Xavier
                      • [^] # Re: San bien configuré ?

                        Posté par  (site web personnel) . Évalué à 2.

                        Bon alors : aptitude install multipath-tools-initramfs , ça va corriger tes problèmes.

                        "It was a bright cold day in April, and the clocks were striking thirteen" - Georges Orwell

                        • [^] # Re: San bien configuré ?

                          Posté par  . Évalué à 1.

                          Je n'ai pas installé multipath-tools-initramfs car dans la description des paquets, ce dernier semble être remplacé par multipath-tools-boot.

                          Du coup, j'ai installé ce dernier avec apt-get, j'ai rebooté, mais je retrouve les mêmes comportements (toujours ce fichu /dev/sda qui couine).

                          Dans mon cas, pas de fichier /usr/share.../multipath_hook, mais un fichier /usr/share/initramfs-tools/hooks/multipath, que voici:

                          fhtpntr2:/dev/mapper# more /usr/share/initramfs-tools/hooks/multipath
                          #!/bin/sh

                          PREREQS="udev"

                          prereqs() { echo "$PREREQS"; }

                          case $1 in
                          prereqs)
                          prereqs
                          exit 0
                          ;;
                          esac

                          if [ ! -x /sbin/multipath ]; then
                          exit 0
                          fi

                          . /usr/share/initramfs-tools/hook-functions

                          add_bindings()
                          {
                          if [ -r /var/lib/multipath/bindings ]; then
                          mkdir -p $DESTDIR/var/lib/multipath
                          cp /var/lib/multipath/bindings $DESTDIR/var/lib/multipath/
                          fi
                          }

                          copy_exec /sbin/multipath /sbin
                          copy_exec /sbin/kpartx /sbin
                          copy_exec /sbin/devmap_name /sbin
                          copy_exec /sbin/dmsetup /sbin
                          copy_exec /lib/udev/dmsetup_env /lib/udev
                          copy_exec /sbin/mpath_prio_alua /sbin
                          copy_exec /sbin/mpath_prio_emc /sbin
                          copy_exec /sbin/mpath_prio_hp_sw /sbin
                          copy_exec /sbin/mpath_prio_rdac /sbin
                          copy_exec /sbin/mpath_prio_netapp /sbin
                          copy_exec /sbin/mpath_prio_random /sbin
                          copy_exec /sbin/mpath_prio_hds_modular /sbin
                          copy_exec /sbin/mpath_prio_balance_units /sbin

                          [ -r /etc/multipath.conf ] && cp /etc/multipath.conf $DESTDIR/etc/
                          add_bindings

                          for x in dm-multipath dm-round-robin dm-emc; do
                          manual_add_modules ${x}
                          done

                          Dans l'esprit, cela ressemble fort à ce qui était indiqué dans le Tchetch's Wiki, donc je n'ai rien modifié dans ce fichier.

                          De plus, j'ai modifié le fichier /boot/grub/device.map comme suit:
                          (hd0) /dev/disk/by-id/scsi-3600508e0000000008a90828d8486310a

                          Cet id pointe vers le /dev/sdc qui représente mon disque virtuel en RAID1, contenant sdc1 (/boot) et sdc2 (/tmp, /home, etc. en LVM)

                          A noter que depuis ces manips, multipath -ll me donne mes 2 paths en enabled, plus de second path en actif.

                          Je sens que nous y sommes presque, mais j'enrage de ne pas trouver ce qui ne va pas...

                          A noter également que le multipath est maintenant sur le dm-0 (au lieu du dm-6) et que la partition que j'avais créée dessus est en dm-1 (au lieu de dm-7).

                          Pour répondre aux autres questions, je fais avec le matériel qui a été commandé. Il y avait 2 disques internes, autant les utiliser (en effet, pour stocker toutes sortes de fichiers temporaires, etc.). De plus, chaque serveur est redondé, donc en cas de grosse panne, sauf catastrophe, il n'y a a priori rien à craindre.
                          • [^] # Re: San bien configuré ?

                            Posté par  (site web personnel) . Évalué à 2.

                            Ok est si tu fais un "update-initramfs -u -k all" pour reconstruire initrd et assurer que ton multipath.conf est bien dedans.

                            J'essaierais aussi avec les options suivantes dans multipath.conf (avant de reconstruire ton initrd tu modifies ton multipath.conf).

                            path_grouping_policy group_by_serial
                            path_checker tur
                            prio_callout "/sbin/mpath_prio_tpc /dev/%n"


                            Donc ton multipath.conf serait comme suit (j'ai effacer les lignes de commentaires et les commentaires sont ce qui était dans ton multipath.conf et que je penses qu'il faut enlever):

                            defaults {
                            # prio_callout /bin/true
                            user_friendly_names yes
                            }

                            blacklist {
                            wwid 3600a0b80005630440000052849bb294d
                            devnode "^(ram|raw|loop|fd|md|dm-|sr|scd|st)[0-9]*"
                            devnode "^hd[a-z][[0-9]*]"
                            devnode "^cciss!c[0-9]d[0-9]*[p[0-9]*]"
                            device {
                            vendor LSILOGIC
                            }
                            }

                            multipaths {
                            multipath {
                            wwid 3600a0b80005629c6000005da4a69747d
                            alias dataftp_paths
                            }
                            }

                            devices {
                            device {
                            vendor "SUN"
                            product "CSM200_R"
                            #path_grouping_policy failover
                            path_grouping_policy group_by_serial
                            #path_checker directio
                            path_checker tur
                            path_selector "round-robin 0"
                            hardware_handler "0"
                            failback 15
                            rr_weight priorities
                            no_path_retry queue
                            rr_min_io 100
                            prio_callout "/sbin/mpath_prio_tpc /dev/%n"
                            }
                            }

                            "It was a bright cold day in April, and the clocks were striking thirteen" - Georges Orwell

                            • [^] # Re: San bien configuré ?

                              Posté par  . Évalué à 1.

                              Argh!!!!

                              Je venais d'écrire un très long message et ploup, il a disparu dans un backspace malheureux... Pfff, je recommence:

                              J'ai donc procédé comme indiqué mais a priori sans résultats probants.

                              Tout d'abord, je n'avais pas de mpath_prio_tpc. J'ai essayé dans un premier temps mpath_prio_random, mais à part changer les numéro de prio dans le multipath -ll, je n'ai pas vu d'actions probantes. J'ai donc mis le mpath_prio_rdac, sans trop savoir ce dont il était question, je l'avoue.

                              J'ai également lancé la commande update-initramfs, puis rebooté. Pas vraiment d'améliorations non plus :'(

                              Au final, et en rajoutant quelques lignes au multipath.conf ci-dessus, voici l'état de mon système:

                              [cite]
                              ##
                              ## This is a template multipath-tools configuration file
                              ## Uncomment the lines relevent to your environment
                              ##
                              defaults {
                              udev_dir /dev
                              selector "round-robin 0"
                              path_grouping_policy group_by_serial
                              getuid_callout "/lib/udev/scsi_id -g -u -d /dev/%n"
                              prio_callout "/sbin/mpath_prio_rdac /dev/%n"
                              path_checker tur
                              rr_min_io 100
                              rr_weight priorities
                              failback manual
                              no_path_retry 3
                              user_friendly_names yes
                              }
                              blacklist {
                              wwid 3600a0b80005630440000052849bb294d
                              devnode "^(ram|raw|loop|fd|md|dm-|sr|scd|st)[0-9]*"
                              devnode "^hd[a-z][[0-9]*]"
                              devnode "^cciss!c[0-9]d[0-9]*[p[0-9]*]"
                              device {
                              vendor LSILOGIC
                              }
                              }

                              multipaths {
                              multipath {
                              wwid 3600a0b80005629c6000005da4a69747d
                              alias dataftp_paths
                              }
                              }
                              devices {
                              device {
                              vendor "SUN"
                              product "CSM200_R"
                              hardware_handler "0"
                              }
                              }
                              [/cite]

                              Le résultat de mon multipath -ll
                              [cite]
                              dataftp_paths (3600a0b80005629c6000005da4a69747d) dm-0 SUN ,CSM200_R
                              [size=650G][features=1 queue_if_no_path][hwhandler=0]
                              \_ round-robin 0 [prio=0][enabled]
                              \_ 0:0:0:2 sda 8:0 [active][ready]
                              \_ round-robin 0 [prio=3][active]
                              \_ 3:0:0:2 sdd 8:48 [active][ready]
                              [/cite]

                              Mon /proc/partitions, commenté ici pour l'occasion:

                              [cite]
                              major minor #blocks name

                              8 0 681574400 sda #path 1, il voit bien le volume, mais bon...
                              8 16 20480 sdb #LUN d'acces 1
                              8 32 71288832 sdc # Disque virtuel de 2 disques en RAID1
                              8 33 248976 sdc1 # /boot
                              8 34 71039430 sdc2 # /LVM avec /tmp, /etc/, /home... sur dm-2 à dm-7
                              8 48 681574400 sdd # Path 2, ça fonctionne
                              8 49 681573658 sdd1 # Partition ext3 créée sur la LUN
                              8 64 20480 sde # LUN d'acces 2
                              254 0 681574400 dm-0 #dev/mapper/dataftp_paths
                              254 1 681573658 dm-1 #/dev/mapper/dataftp_paths-part1
                              254 2 339968 dm-2
                              254 3 4882432 dm-3
                              254 4 2928640 dm-4
                              254 5 8261632 dm-5
                              254 6 389120 dm-6
                              254 7 54235136 dm-7
                              [/cite]

                              Mon fichier /boot/grub/device.map après modif (il ne voit plus /dev/sda):
                              [cite]
                              (hd0) /dev/disk/by-id/scsi-3600508e0000000008a90828d8486310a
                              (hd1) /dev/sdc
                              (hd2) /dev/sdd
                              (hd3) /dev/sde
                              [/cite]

                              J'ai également regardé dans le dmesg, voici des choses qui pourraient être intéressantes (j'ai enlevé des lignes qui ne concernaient pas les éléments liés au SAN):
                              [cite]
                              [ 3.961210] qla2xxx 0000:06:00.0: Found an ISP2432, irq 16, iobase 0xffffc20001856000
                              [ 3.961210] qla2xxx 0000:06:00.0: Configuring PCI space...
                              [ 3.961210] PCI: Setting latency timer of device 0000:06:00.0 to 64
                              [ 3.965208] qla2xxx 0000:06:00.0: Configure NVRAM parameters...
                              [ 3.976646] usb 2-1: configuration #1 chosen from 1 choice
                              [ 3.976646] usb 2-1: New USB device found, idVendor=0451, idProduct=625f
                              [ 3.976646] usb 2-1: New USB device strings: Mfr=5, Product=2, SerialNumber=1
                              [ 3.976646] usb 2-1: Product: 6250 FW: 04.02.02.22.562AD423
                              [ 3.976646] usb 2-1: Manufacturer: Texas Instruments Incorporated
                              [ 3.976646] usb 2-1: SerialNumber: B0391F843727
                              [ 4.077121] Initializing USB Mass Storage driver...
                              [ 4.091648] qla2xxx 0000:06:00.0: Verifying loaded RISC code...
                              [ 4.106420] firmware: requesting ql2400_fw.bin
                              [ 4.335148] qla2xxx 0000:06:00.0: Allocated (64 KB) for EFT...
                              [ 4.335214] qla2xxx 0000:06:00.0: Allocated (1413 KB) for firmware dump...
                              [ 4.366963] scsi0 : qla2xxx
                              [ 4.367199] qla2xxx 0000:06:00.0:
                              [ 4.367199] QLogic Fibre Channel HBA Driver: 8.02.01-k4
                              [ 4.367199] QLogic QLE2460 - Sun PCI-Express to 2Gb FC, Single Channel
                              [ 4.367199] ISP2432: PCIe (2.5GT/s x4) @ 0000:06:00.0 hdma+, host#=0, fw=4.04.05 [IP] [84XX]
                              [ 4.830719] qla2xxx 0000:06:00.0: LIP reset occured (f700).
                              [ 5.006645] qla2xxx 0000:06:00.0: LOOP UP detected (4 Gbps).
                              [ 5.046613] scsi 0:0:0:0: Direct-Access SUN CSM200_R 0750 PQ: 1 ANSI: 5
                              [ 5.087486] scsi 0:0:0:2: Direct-Access SUN CSM200_R 0750 PQ: 0 ANSI: 5
                              [ 5.091479] scsi 0:0:0:31: Direct-Access SUN Universal Xport 0750 PQ: 0 ANSI: 5
                              [ 5.127747] ioc0: LSISAS1068E B2: Capabilities={Initiator}
                              [ 14.941907] scsi 0:0:0:0: Attached scsi generic sg0 type 0
                              [ 14.941928] scsi 0:0:0:2: Attached scsi generic sg1 type 0
                              [ 14.941946] scsi 0:0:0:31: Attached scsi generic sg2 type 0
                              [ 14.941968] sr 1:0:0:0: Attached scsi generic sg3 type 5
                              [ 33.421973] scsi2 : ioc0: LSISAS1068E B2, FwRev=01175a00h, Ports=1, MaxQ=286, IRQ=1269
                              [ 34.453477] scsi 2:0:0:0: Direct-Access HITACHI H101473SCSUN72G SA25 PQ: 0 ANSI: 5
                              [ 34.453477] scsi 2:0:0:0: Attached scsi generic sg4 type 0
                              [ 34.453477] scsi 2:0:1:0: Direct-Access HITACHI H101473SCSUN72G SA25 PQ: 0 ANSI: 5
                              [ 34.454674] scsi 2:0:1:0: Attached scsi generic sg5 type 0
                              [ 34.462334] scsi 2:0:2:0: Enclosure LSILOGIC SASX28 A.0 5021 PQ: 0 ANSI: 5
                              [ 34.484881] scsi 2:0:2:0: Attached scsi generic sg6 type 13
                              [ 34.489401] scsi 2:1:0:0: Direct-Access LSILOGIC Logical Volume 3000 PQ: 0 ANSI: 2
                              [ 34.489454] scsi 2:1:0:0: Attached scsi generic sg7 type 0
                              [ 34.489401] ACPI: PCI Interrupt Link [LE3B] enabled at IRQ 43
                              [ 34.489401] ACPI: PCI Interrupt 0000:83:00.0[A] -> Link [LE3B] -> GSI 43 (level, low) -> IRQ 43
                              [ 34.489401] qla2xxx 0000:83:00.0: Found an ISP2432, irq 43, iobase 0xffffc20001860000
                              [ 34.489401] qla2xxx 0000:83:00.0: Configuring PCI space...
                              [ 34.489401] PCI: Setting latency timer of device 0000:83:00.0 to 64
                              [ 34.494819] qla2xxx 0000:83:00.0: Configure NVRAM parameters...
                              [ 34.646634] Driver 'sd' needs updating - please use bus_type methods
                              [ 34.649892] sd 0:0:0:2: [sda] 1363148800 512-byte hardware sectors (697932 MB)
                              [ 34.650638] sd 0:0:0:2: [sda] Write Protect is off
                              [ 34.650638] sd 0:0:0:2: [sda] Mode Sense: 77 00 10 08
                              [ 34.650638] sd 0:0:0:2: [sda] Write cache: enabled, read cache: enabled, supports DPO and FUA
                              [ 34.650638] sd 0:0:0:2: [sda] 1363148800 512-byte hardware sectors (697932 MB)
                              [ 34.650638] scsi 0:0:0:0: Embedded Enclosure Device
                              [ 34.650638] scsi 0:0:0:0: Failed to get diagnostic page 0x8000002
                              [ 34.650638] scsi 0:0:0:0: Failed to bind enclosure -19
                              [ 34.650638] sd 0:0:0:2: Embedded Enclosure Device
                              [ 34.650638] sd 0:0:0:2: [sda] Write Protect is off
                              [ 34.650638] sd 0:0:0:2: [sda] Mode Sense: 77 00 10 08
                              [ 34.651629] sd 0:0:0:2: [sda] Write cache: enabled, read cache: enabled, supports DPO and FUA
                              [ 34.651629] sda:<6>qla2xxx 0000:83:00.0: Verifying loaded RISC code...
                              [ 34.839002] scsi 0:0:0:31: Embedded Enclosure Device
                              [ 34.839002] scsi 0:0:0:31: Failed to get diagnostic page 0x8000002
                              [ 34.839002] scsi 0:0:0:31: Failed to bind enclosure -19
                              [ 35.018178] Driver 'ses' needs updating - please use bus_type methods
                              [ 35.059012] qla2xxx 0000:83:00.0: Allocated (64 KB) for EFT...
                              [ 35.059089] qla2xxx 0000:83:00.0: Allocated (1413 KB) for firmware dump...
                              [ 35.090021] scsi3 : qla2xxx
                              [ 35.090021] qla2xxx 0000:83:00.0:
                              [ 35.090021] QLogic Fibre Channel HBA Driver: 8.02.01-k4
                              [ 35.090021] QLogic QLE2460 - Sun PCI-Express to 2Gb FC, Single Channel
                              [ 35.090021] ISP2432: PCIe (2.5GT/s x4) @ 0000:83:00.0 hdma+, host#=3, fw=4.04.05 [IP] [84XX]
                              [ 35.306861] end_request: I/O error, dev sda, sector 0
                              [ 35.306861] Buffer I/O error on device sda, logical block 0
                              [ 35.358825] qla2xxx 0000:83:00.0: LIP reset occured (f700).
                              [ 35.358825] qla2xxx 0000:83:00.0: LIP occured (f700).
                              [ 35.358825] qla2xxx 0000:83:00.0: LIP reset occured (f7f7).
                              [ 35.427735] ata1: SATA link down (SStatus 0 SControl 300)
                              [ 35.358825] qla2xxx 0000:83:00.0: LOOP UP detected (4 Gbps).
                              [ 35.926631] ata2: SATA link down (SStatus 0 SControl 300)
                              [ 35.926621] ACPI: PCI Interrupt Link [LSA1] enabled at IRQ 22
                              [ 35.926621] ACPI: PCI Interrupt 0000:00:05.1[B] -> Link [LSA1] -> GSI 22 (level, low) -> IRQ 22
                              [ 35.926621] sata_nv 0000:00:05.1: Using SWNCQ mode
                              [ 35.926621] PCI: Setting latency timer of device 0000:00:05.1 to 64
                              [ 35.926621] scsi6 : sata_nv
                              [ 35.926621] scsi7 : sata_nv
                              [ 35.926621] ata3: SATA max UDMA/133 cmd 0x6880 ctl 0x6800 bmdma 0x6080 irq 22
                              [ 35.926621] ata4: SATA max UDMA/133 cmd 0x6480 ctl 0x6400 bmdma 0x6088 irq 22
                              [ 36.069946] end_request: I/O error, dev sda, sector 0
                              [ 36.069946] Buffer I/O error on device sda, logical block 0
                              [ 36.193523] scsi 3:0:0:0: Direct-Access SUN CSM200_R 0750 PQ: 1 ANSI: 5
                              [ 36.232876] scsi 3:0:0:2: Direct-Access SUN CSM200_R 0750 PQ: 0 ANSI: 5
                              [ 36.239891] scsi 3:0:0:31: Direct-Access SUN Universal Xport 0750 PQ: 0 ANSI: 5
                              [ 36.240234] scsi 3:0:0:0: Attached scsi generic sg8 type 0
                              [ 36.240237] scsi 3:0:0:0: Embedded Enclosure Device
                              [ 36.241015] scsi 3:0:0:0: Failed to get diagnostic page 0x8000002
                              [ 36.241087] scsi 3:0:0:0: Failed to bind enclosure -19
                              [ 36.241217] scsi 3:0:0:2: Attached scsi generic sg9 type 0
                              [ 36.241219] scsi 3:0:0:2: Embedded Enclosure Device
                              [ 36.397101] ata3: SATA link down (SStatus 0 SControl 300)
                              [ 36.481007] scsi 3:0:0:31: Attached scsi generic sg10 type 0
                              [ 36.481007] scsi 3:0:0:31: Embedded Enclosure Device
                              [ 36.792066] end_request: I/O error, dev sda, sector 0
                              [ 36.792066] Buffer I/O error on device sda, logical block 0
                              [ 40.050545] end_request: I/O error, dev sda, sector 0
                              [ 40.050545] Buffer I/O error on device sda, logical block 0
                              [ 40.841972] ata11: SATA link down (SStatus 0 SControl 300)
                              [ 41.130441] end_request: I/O error, dev sda, sector 0
                              [ 41.130441] Buffer I/O error on device sda, logical block 0
                              [ 41.246636] ata12: SATA link down (SStatus 0 SControl 300)
                              [ 42.402836] end_request: I/O error, dev sda, sector 0
                              [ 42.402836] Buffer I/O error on device sda, logical block 0
                              [ 42.402836] Dev sda: unable to read RDB block 0
                              [ 43.030006] end_request: I/O error, dev sda, sector 0
                              [ 43.030006] Buffer I/O error on device sda, logical block 0
                              [ 45.332475] end_request: I/O error, dev sda, sector 0
                              [ 45.332475] unable to read partition table
                              [ 45.332475] sd 0:0:0:2: [sda] Attached SCSI disk
                              [ 45.332475] sd 0:0:0:31: [sdb] 40960 512-byte hardware sectors (21 MB)
                              [ 45.332475] sd 0:0:0:31: [sdb] Write Protect is off
                              [ 45.332475] sd 0:0:0:31: [sdb] Mode Sense: 77 00 10 08
                              [ 45.332475] sd 0:0:0:31: [sdb] Write cache: disabled, read cache: enabled, supports DPO and FUA
                              [ 45.332475] sd 0:0:0:31: [sdb] 40960 512-byte hardware sectors (21 MB)
                              [ 45.332475] sd 0:0:0:31: [sdb] Write Protect is off
                              [ 45.332475] sd 0:0:0:31: [sdb] Mode Sense: 77 00 10 08
                              [ 45.332475] sd 0:0:0:31: [sdb] Write cache: disabled, read cache: enabled, supports DPO and FUA
                              [ 45.332475] sdb:
                              [ 46.210043] sd 0:0:0:31: [sdb] Attached SCSI disk
                              [ 46.210043] ses 2:0:2:0: Attached Enclosure device
                              [ 46.210043] sd 2:1:0:0: [sdc] 142577664 512-byte hardware sectors (73000 MB)
                              [ 46.210072] sd 2:1:0:0: [sdc] Write Protect is off
                              [ 46.210074] sd 2:1:0:0: [sdc] Mode Sense: 03 00 00 08
                              [ 46.210458] sd 2:1:0:0: [sdc] Write cache: disabled, read cache: enabled, doesn't support DPO or FUA
                              [ 46.210678] sd 2:1:0:0: [sdc] 142577664 512-byte hardware sectors (73000 MB)
                              [ 46.210902] sd 2:1:0:0: [sdc] Write Protect is off
                              [ 46.210904] sd 2:1:0:0: [sdc] Mode Sense: 03 00 00 08
                              [ 46.211287] sd 2:1:0:0: [sdc] Write cache: disabled, read cache: enabled, doesn't support DPO or FUA
                              [ 46.211289] sdc: sdc1 sdc2
                              [ 46.228780] sd 2:1:0:0: [sdc] Attached SCSI disk
                              [ 46.262626] sd 3:0:0:2: [sdd] 1363148800 512-byte hardware sectors (697932 MB)
                              [ 46.262815] sd 3:0:0:2: [sdd] Write Protect is off
                              [ 46.262817] sd 3:0:0:2: [sdd] Mode Sense: 77 00 10 08
                              [ 46.263158] sd 3:0:0:2: [sdd] Write cache: enabled, read cache: enabled, supports DPO and FUA
                              [ 46.263497] sd 3:0:0:2: [sdd] 1363148800 512-byte hardware sectors (697932 MB)
                              [ 46.263663] sd 3:0:0:2: [sdd] Write Protect is off
                              [ 46.263665] sd 3:0:0:2: [sdd] Mode Sense: 77 00 10 08
                              [ 46.264000] sd 3:0:0:2: [sdd] Write cache: enabled, read cache: enabled, supports DPO and FUA
                              [ 46.264004] sdd: sdd1
                              [ 46.264276] sd 3:0:0:2: [sdd] Attached SCSI disk
                              [ 46.266337] sd 3:0:0:31: [sde] 40960 512-byte hardware sectors (21 MB)
                              [ 46.266502] sd 3:0:0:31: [sde] Write Protect is off
                              [ 46.266504] sd 3:0:0:31: [sde] Mode Sense: 77 00 10 08
                              [ 46.266782] sd 3:0:0:31: [sde] Write cache: disabled, read cache: enabled, supports DPO and FUA
                              [ 46.266782] sd 3:0:0:31: [sde] 40960 512-byte hardware sectors (21 MB)
                              [ 46.266782] sd 3:0:0:31: [sde] Write Protect is off
                              [ 46.266782] sd 3:0:0:31: [sde] Mode Sense: 77 00 10 08
                              [/cite]

                              Je me rappelle qu'on avait un peu cherché lors de l'installation pour intégrer le microcode des QLogic 2460 qui sont les liens du PC vers le SAN.
                              On est passé par 2 méthodes:
                              - Une où on dépose le fichier ql2400_fw.bin sur une clé usb à l'invite du système, et elle se poursuit normalement.
                              - Une où on a téléchargé le fichier firmware-qlogic_0.17_all.dev trouvé ici : [http://debian.mirror.inra.fr/debian/pool/non-free/f/firmware(...)], puis:
                              dpkg -i firmware-qlogic_0.17_all.deb
                              modprobe -r ql2xxx
                              modprobe ql2xxx

                              Le fichier ql2400_fw.bin se trouve sous /lib/firmware.

                              Bref, c'est pas encore gagné...

                              Xavier
                              • [^] # Re: San bien configuré ?

                                Posté par  (site web personnel) . Évalué à 2.

                                Alors je ne penses pas pouvoir t'aider plus actuellement il me semble que rien ne devrais empêcher ton système de fonctionner. Il faut que je réfléchisse.

                                Sinon les firmware ql2xxx sont dans non-free de Debian donc modifies sources.list, ajoute non-free, aptitude update, aptitude install firmware-qlogic !

                                "It was a bright cold day in April, and the clocks were striking thirteen" - Georges Orwell

                                • [^] # Re: San bien configuré ?

                                  Posté par  . Évalué à 1.

                                  Quand vous installez vos Debian sur des systèmes en double attachement, est-ce que branchez vos fibres à l'installation?

                                  En effet, j'ai fait les 2:
                                  - Débranchement des fibres + installation OS = situation actuelle
                                  - Fibres branchées + installation OS = gros plantage au premier démarrage. Il me lance un prompt initramfs et m'insulte car il ne trouve pas hd(0,0) (de mémoire). Ne sachant trop quoi faire, je n'ai pas persisté dans cette voie, mais suivant ce que vous allez me dire, je pourrais m'y replonger.

                                  Merci pour votre participation en tout cas.

                                  Xavier
                                  • [^] # Re: San bien configuré ?

                                    Posté par  (site web personnel) . Évalué à 2.

                                    Je garde les fibres branchées, je vais pas m'amuser à débrancher les fibres pour une installation.

                                    Sinon tu as dit que tu ne faisais pas du boot on san alors que visiblement tu en fais, sinon tu n'aurais pas de problèmes avec le démarrage comme ça.

                                    "It was a bright cold day in April, and the clocks were striking thirteen" - Georges Orwell

                                    • [^] # Re: San bien configuré ?

                                      Posté par  . Évalué à 1.

                                      Non, non, je confirme que je ne fais pas de boot on san. J'ai installé le multipath-tools-boot à l'invite des forumistes car ça pouvait résoudre mon problème malgré tout.

                                      J'ai bien essayé de laisser brancher les fibres au démarrage, mais je me souviens avoir eu un gros bug au démarrage (que je n'ai pas su résoudre à l'époque, alors je n'ai pas persisté dans cette voie).

                                      Y a-t-il des précautions à prendre si on laisse les fibres branchées lors de l'installation?

                                      Xavier
                                    • [^] # Re: San bien configuré ?

                                      Posté par  . Évalué à 1.

                                      Non, non, je confirme que je ne fais pas de boot on san. J'ai installé le multipath-tools-boot à l'invite des forumistes car ça pouvait résoudre mon problème malgré tout.

                                      J'ai bien essayé de laisser brancher les fibres au démarrage, mais je me souviens avoir eu un gros bug au démarrage (que je n'ai pas su résoudre à l'époque, alors je n'ai pas persisté dans cette voie).

                                      Y a-t-il des précautions à prendre si on laisse les fibres branchées lors de l'installation?

                                      Xavier
                                • [^] # Re: San bien configuré ?

                                  Posté par  . Évalué à 1.

                                  Quand vous installez vos Debian sur des systèmes en double attachement, est-ce que branchez vos fibres à l'installation?

                                  En effet, j'ai fait les 2:
                                  - Débranchement des fibres + installation OS = situation actuelle
                                  - Fibres branchées + installation OS = gros plantage au premier démarrage. Il me lance un prompt initramfs et m'insulte car il ne trouve pas hd(0,0) (de mémoire). Ne sachant trop quoi faire, je n'ai pas persisté dans cette voie, mais suivant ce que vous allez me dire, je pourrais m'y replonger.

                                  Merci pour votre participation en tout cas.

                                  Xavier
                    • [^] # Re: San bien configuré ?

                      Posté par  . Évalué à 1.

                      Pour rappel, je ne fais pas de boot on SAN, je boote uniquement sur mes 2 disques internes configurés en RAID1.

                      Pour les fichiers:

                      Pas de fichier /usr/share/initramfe/hooks/multipath_hook!

                      /etc/fstab:
                      # /etc/fstab: static file system information.
                      #
                      # <file system> <mount point>
                      proc /proc proc defaults 0 0
                      /dev/mapper/fhtpntr2-root / ext3 errors=remount-ro 0 1
                      UUID=46e8b672-43f4-490c-9ffb-b276febe0602 /boot ext2 defaults 0 2
                      /dev/mapper/fhtpntr2-home /home ext3 defaults 0 2
                      /dev/mapper/fhtpntr2-tmp /tmp ext3 defaults 0 2
                      /dev/mapper/fhtpntr2-usr /usr ext3 defaults 0 2
                      /dev/mapper/fhtpntr2-var /var ext3 defaults 0 2
                      /dev/mapper/fhtpntr2-swap_1 none swap sw 0 0
                      /dev/mapper/dataftp_paths-part1 /dataftp ext3 defaults 0 2
                      /dev/scd0 /media/cdrom0 udf,iso9660 user,noauto 0 0

                      Je monte le /boot par l'UUID du disque interne.
                      Je monte mon volume SAN sur /dataftp

                      Et le /boot/grub/menu.lst (je n'ai pas modifié les options par défaut)
                      title Debian GNU/Linux, kernel 2.6.26-2-amd64
                      root (hd0,0)
                      kernel /vmlinuz-2.6.26-2-amd64 root=/dev/mapper/fhtpntr2-root ro quiet
                      initrd /initrd.img-2.6.26-2-amd64

                      title Debian GNU/Linux, kernel 2.6.26-2-amd64 (single-user mode)
                      root (hd0,0)
                      kernel /vmlinuz-2.6.26-2-amd64 root=/dev/mapper/fhtpntr2-root ro single
                      initrd /initrd.img-2.6.26-2-amd64

                      En fait, dans ce fichier /boot/grub/device.map, plutôt que de voir /dev/sda, je me serais attendu à voir un chemin vers mes disques de boot internes (souvent en /dev/sdc, mais le mieux, c'est de prendre l'UUID).

                      Xavier
                      • [^] # Re: San bien configuré ?

                        Posté par  (site web personnel) . Évalué à 2.

                        C'est pas grave ton noyau va quand même lire les disques au démarrage donc il faut le multipath dès le début. Par contre t'as pas besoin de corriger grub.

                        Mais sinon à quoi ça sert d'avoir 2 disques en raid1 en interne du blade si tu as un SAN (à part plus des pièces en plus qui peuvent lâcher et perdre des avantages essentiels du couple blade-SAN comme pouvoir relancer ton système sur une autre lame au cas où le processeur/ram/carte mère/carte réseau/... grille dans ta lame, flash copy de ton système avant un upgrade vers une nouvelle release, ...) ?

                        "It was a bright cold day in April, and the clocks were striking thirteen" - Georges Orwell

                        • [^] # Re: San bien configuré ?

                          Posté par  . Évalué à 1.

                          Pour la distribution, si tu es plus à l'aise sous Debian, reste-y.
                          Perso, par manque de temps on a prit Redhat ... Bah c'est pas vraiment le pied ...

                          Pour ton grub, tout pareil qu'Etienne (merci à lui d'avoir répondu ;))
                          Par contre pour le coup des disques, je pense que c'est plutôt : "C'est livré avec, autant les utiliser."
                          (même si, ils peuvent servir à autre chose, pour stocker des backups journaliers ou des fichiers temporaires de traitements.)

                          Si le proc / ram / cm / carte réseau grille, tu pleures et tu espères que le contrat de maintenance c'est déplacement et intervention en moins de 4H ... Mais rien n'empêche d'avoir une lame de spare.
                          • [^] # Re: San bien configuré ?

                            Posté par  (site web personnel) . Évalué à 2.

                            "C'est livré avec, autant les utiliser."
                            Tu peux commander sans, c'est moins chère, donc nous on a pas de disque interne sur nos blades.

                            (même si, ils peuvent servir à autre chose, pour stocker des backups journaliers ou des fichiers temporaires de traitements.)

                            Genre /tmp et/ou /var ouais.

                            Mais rien n'empêche d'avoir une lame de spare

                            Où alors tu as des services moins importants que d'autres. Si tu as la lame qui contient ton partage de fichier dans l'entreprise qui grille, je ne me poserais même pas la question si je coupe le serveur web ou pas pour continuer à avoir samba sur mon réseau. Le serveur web serait arrêter dans la seconde qui suit et le serveur samba démarrer en lieu et place du serveur web.
                            Après ça dépend tes services et comment tu les groupes. Il y a certain truc ton système peut tourner un à deux jours sans (les proxy par exemple, tu passes tout le monde en directe) et il y a d'autres trucs qui empêchent simplement l'entreprise de fonctionner sans. Donc même si tu n'as pas de lame en spare (où que tu as la poisse et que hier une lame a grillé et aujourd'hui une autre), je m'arrange toujours pour avoir diverses mode de fonctionnement : high (tous les services), medium (les services peut important coupés) ou low (les services vitaux uniquement). J'ai un script qui me permet de passer dans un de ces modes. En mode low, j'ai que deux lames qui sont nécessaires, donc quand il y a une coupure de courant on passe directement en mode low et on consomme moins d'énergie. (Mais mes scripts sont pas encore au point, mais ça devient de plus en plus affiné).

                            "It was a bright cold day in April, and the clocks were striking thirteen" - Georges Orwell

  • # Problème Multipath-tools

    Posté par  . Évalué à 1.

    Bonjour,

    Le type de baie de disques SUN 6140 est reconnu comme CSM200_R.
    Il est possible de vérifier le support de son matériel, en exécutant les commandes suivantes:

    #multipathd -k
    > show config
    ... une visualisation de la configuration et des matériels supportés.
    ... CTRL-D pour ressortir.

    Normalement la version du device-mapper-multipath-0.4.7 supporte la baie de disques de type CSM200_R.
    Cependant pour ne pas rencontrer les I/O errors, lors de la réinitialisation du serveur, il faudra configurer le host type de ton serveur en "Solaris_dmp" sur la baie de disques.
    Le package device-mapper-multipath travaille étroitement avec udev.

    Si jamais, on utilise les commandes LVM les luns basculeront, pour les commandes de découverte les luns reviendront sur leur "preferred path", pour les autres de types lvcreate,lvremove les luns ne reviendront pas sur leur "preferred path".

    Sinon, trouve ci-après un exemple de configuration:
    Les disques internes devront être configurés dans l'option blacklist devnode.
    -----------------------------------------------
    device-mapper-multipath-0.4.7
    fichier /etc/multipath.conf
    -----------------------------------------------
    ...
    ...
    blacklist {
    devnode "^(ram|raw|loop|fd|md|dm-|sr|scd|st)[0-9]*"
    devnode "^hd[a-z]"
    devnode "^sda"
    }
    ...
    ...
    multipaths {
    devices {
    device {
    vendor "SUN"
    product "CSM200_R"
    getuid_callout "/sbin/scsi_id -g -u -s /block/%n"
    path_checker rdac
    path_grouping_policy group_by_prio
    prio_callout "/sbin/mpath_prio_tpc /dev/%n"
    failback immediate
    }
    }
    }


    En espérant que ce message pourra aider.
    • [^] # Re: Problème Multipath-tools

      Posté par  . Évalué à 1.

      Pour le problème LVM, il suffit de modifier le fichier /etc/lvm.conf comme dans la note Redhat.



      After creating multipath devices, you can use the multipath device names just as you would use a physical device name when creating an LVM physical volume. For example, if /dev/mapper/mpath0 is the name of a multipath device, the following command will mark /dev/mapper/mpath0 as a physical volume.

      pvcreate /dev/mapper/mpath0

      You can use the resulting LVM physical device when you create an LVM volume group just as you would use any other LVM physical device.
      When you create an LVM logical volume that uses active/passive multipath arrays as the underlying physical devices, you should include filters in the lvm.conf file to exclude the disks that underlie the multipath devices. This is because if the array automatically changes the active path to the passive path when it receives I/O, multipath will failover and failback whenever LVM scans the passive path if these devices are not filtered. For active/passive arrays that require a command to make the passive path active, LVM prints a warning message when this occurs.
      To filter all SCSI devices in the multipath configuration file (lvm.conf), include the following filter in the devices section of the file.

      filter = [ "r/disk/", "r/sd.*/", "a/.*/" ]

      Short Linker
      http://www.redhat.com/docs/en-US/Red_Hat_Enterprise_Linux/4.(...)

      Nota:
      Run vgscan after you change this parameter to ensure that the cache file gets regenerated.
      • [^] # Re: Problème Multipath-tools

        Posté par  . Évalué à 1.

        Complément d'information:

        La définition par défaut de la baie de disques CSM200_R avec device-mapper-multipath-0.4.7 est la suivante:

        résultat des commandes suivantes
        (le fichier a été tronqué volaontairement pour des raisons de lectures)

        #multipathd -k
        show config
        .
        .
        .
        device {
        vendor SUN
        product CSM200_R
        path_grouping_policy group_by_prio
        path_checker rdac
        hardware_handler 1 rdac
        prio_callout /sbin/mpath_prio_rdac /dev/%n
        failback immediate
        no_path_retry queue
        }

        .
        .
        .
        CTRL-D pour sortir

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.