Forum Linux.redhat Truc bizarre réseau

Posté par  .
Étiquettes : aucune
0
28
déc.
2007
Salut à tous,

J'ai un serveur RHEL5 qui, par moment, rame. Par exemple, j'ai une session ssh ouverte sur ce serveur et d'un seul coup, ca freeze. Et au bout de quelques minutes, j'ai à nouveau la main.

J'ai fouillé le sshd.conf, vérifier les fichiers réseaux, le bonding .. bref, rien qui puisse expliquer ces coupures.

Et puis là j'ai un truc bizarre, avec ip link list :

1: lo: mtu 16436 qdisc noqueue
link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
2: eth0: mtu 1500 qdisc pfifo_fast master bond0 qlen 1000
link/ether 00:15:17:48:79:c0 brd ff:ff:ff:ff:ff:ff
3: eth3: mtu 1500 qdisc noop qlen 1000
link/ether 00:15:17:48:79:c1 brd ff:ff:ff:ff:ff:ff
4: eth2: mtu 1500 qdisc pfifo_fast master bond0 qlen 1000
link/ether 00:15:17:48:79:c0 brd ff:ff:ff:ff:ff:ff
5: __tmp204226134: mtu 1500 qdisc noop qlen 1000
link/ether 00:1d:09:0b:3f:9b brd ff:ff:ff:ff:ff:ff
6: bond0: mtu 1500 qdisc noqueue
link/ether 00:15:17:48:79:c0 brd ff:ff:ff:ff:ff:ff
7: sit0: mtu 1480 qdisc noop
link/sit 0.0.0.0 brd 0.0.0.0


La carte en 5, qui est censé être eth1 apparait en tmp.

Question : C'est quoi ce truc ?

Toute aide sera bienvenue car mon serveur est en prod dans quelques jours ...

Merci d'avance
  • # kudzu

    Posté par  (site web personnel) . Évalué à 2.

    chkconfig --del kudzu

    le renommage sauvage des interfaces est une spécialité kudzu

    (autre piste : si server NFS et si reuetes clientes incessantes vers points de montage inexistants (autoumont clients pas à jour par exemple) : alors le kernel redhat n' est pas fichu de fermer les sockets... après qq centaines, le système a du mal (...) alors si 1000 sont demandés, tu vois ce qui peux se passer ?)
    • [^] # Re: kudzu

      Posté par  . Évalué à 1.

      Salut,

      Je suis toujours sur mon problème de freeze ssh. J'ai supprimé kudzu mais le freeze est toujours là.

      J'ai parmi mes modules chargés, ceux qui correspondent à iptables et ip6tables. Je n'arrive pas à les enlever (iptables et ip6tables sont arrêtés). J'ai fouillé sur le net et vérifié dans le fichier de config dans /boot, avec la commande suivante:
      grep "CONFIG_MODULE_FORCE_UNLOAD" /boot/config-$(uname -r), ce qui me renvoie:

      # CONFIG_MODULE_FORCE_UNLOAD is not set

      Question : est ce que je peux changer à chaud cette ligne ? Suis je obligé de redémarré mon serveur ?

      Enfin, que faut il mettre précisément dans le sshd_config pour que la connexion cliente ssh ne tombe jamais ?

      Merci
    • [^] # Re: kudzu

      Posté par  . Évalué à 1.

      Salut,

      Je suis toujours sur mon problème de freeze ssh. J'ai supprimé kudzu mais le freeze est toujours là.

      J'ai parmi mes modules chargés, ceux qui correspondent à iptables et ip6tables. Je n'arrive pas à les enlever (iptables et ip6tables sont arrêtés). J'ai fouillé sur le net et vérifié dans le fichier de config dans /boot, avec la commande suivante:
      grep "CONFIG_MODULE_FORCE_UNLOAD" /boot/config-$(uname -r), ce qui me renvoie:

      # CONFIG_MODULE_FORCE_UNLOAD is not set

      Question : est ce que je peux changer à chaud cette ligne ? Suis je obligé de redémarré mon serveur ?

      Enfin, que faut il mettre précisément dans le sshd_config pour que la connexion cliente ssh ne tombe jamais ?

      Merci
      • [^] # bonding ?

        Posté par  . Évalué à 1.

        Salut,

        As-tu essayé de virer le bonding temporairement, afin de savoir si c'est lui qui est la cause du problème de freeze réseeau ?
        • [^] # Re: bonding ?

          Posté par  . Évalué à 1.

          Effectivement sans bonding ,ca va mieux. je tombe à du 0% de perte pour un ping par exemple.

          je continue a fouiller
      • [^] # Re: kudzu

        Posté par  . Évalué à 1.

        Re-salut,

        Regarde ce thread, pour "stabiliser" ton bonding :
        http://forums11.itrc.hp.com/service/forums/questionanswer.do(...)
        • [^] # Re: kudzu

          Posté par  . Évalué à 1.

          bon .. ca rame toujours ...

          cat /etc/modprobe.conf
          alias eth0 bnx2

          #alias eth1 bnx2

          alias eth2 e1000

          #alias eth3 e1000

          alias scsi_hostadapter megaraid_sas

          alias scsi_hostadapter1 usb-storage

          alias bond0 bonding

          options bond0 mode=1 miimon=100 primary=eth0

          cat /etc/sysconfig/network-scripts/ifcfg-eth0

          DEVICE=eth0

          BOOTPROTO=none

          HWADDR=00:1d:09:0b:3f:99

          ONBOOT=yes

          SLAVE=yes

          MASTER=bond0

          cat /etc/sysconfig/network-scripts/ifcfg-eth2

          DEVICE=eth2

          BOOTPROTO=none

          HWADDR=00:15:17:48:79:c0

          ONBOOT=yes

          SLAVE=yes

          MASTER=bond0

          cat /etc/sysconfig/network-scripts/ifcfg-bond0

          ONBOOT=yes

          DEVICE=bond0

          BOOTPROTO=none

          IPADDR=192.168.22.3

          NETWORK=192.168.22.0

          NETMASK=255.255.255.0

          BROADCAST=192.168.22.255

          GATEWAY=192.168.22.1


          bref ....
          • [^] # Re: kudzu

            Posté par  . Évalué à 1.

            Tu as essayé de "réactiver" tes 2 autres interfaces dans /etc/modprobe.conf ? Et tu crées un fichier ifcfg-eth1 et un autre ifcfg-eth3, en mettant seulement les lignes ONBOOT=yes et leur adresse MAC (HWADDR) ?

            Essaies peut-être aussi d'enlever la directive HWADDR= de tous les fichiers ifcfg-eth* .

            -> Le but étant que ip link list te nomme correctement toutes tes interfaces.

            * Si tu as un serveur Dell PowerEdge 2950 server ou un HP ProLiant BL480c G1 server, regarde cette page qui parle de problèmes de nommage de cartes sur ces serveurs :
            http://www.cyberciti.biz/tips/howto-fix-rhel-centos-nic-orde(...)

            * Regarde aussi si tes interfaces sont au moins en 100 Mbits, avec ethtool <nom_interface> .

            * Pour dissocier les problèmes de perfs réseau d'avec un problème de configuration du bonding, désactive le
            ->
            Tu déplaces tous tes fichiers ifcfg-eth* et ifcfg-bond0 dans un répertoire séparé, puis tu arrêtes le réseau : ifdown -a.
            Puis tu copies le fichier sauvegardé ifcfg-bond0 dans ifcfg-eth0, renommes le DEVICE en eth0 puis , tu relances : ifup -a

            Si tu observes toujours des problèmes de déconnexions réseau, regarde au niveau de la configuration de la carte (vitesse, autonégociation, ...). Essaie de changer de driver ...

            Si tu n'as pas de problèmes de déconnexions sans le bonding, le problème vient de lui. Penses à te mettre au dernier niveau du kernel de Red Hat (de plus, ils en sont à la RHEL 5.1 en ce moment).

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.