Linux.redhat : Truc bizarre réseau

Posté par ArLouarn Mog () le 28 décembre 2007
0

Salut à tous,



J'ai un serveur RHEL5 qui, par moment, rame. Par exemple, j'ai une session ssh ouverte sur ce serveur et d'un seul coup, ca freeze. Et au bout de quelques minutes, j'ai à nouveau la main.



J'ai fouillé le sshd.conf, vérifier les fichiers réseaux, le bonding .. bref, rien qui puisse expliquer ces coupures.



Et puis là j'ai un truc bizarre, avec ip link list :



1: lo: mtu 16436 qdisc noqueue

link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00

2: eth0: mtu 1500 qdisc pfifo_fast master bond0 qlen 1000

link/ether 00:15:17:48:79:c0 brd ff:ff:ff:ff:ff:ff

3: eth3: mtu 1500 qdisc noop qlen 1000

link/ether 00:15:17:48:79:c1 brd ff:ff:ff:ff:ff:ff

4: eth2: mtu 1500 qdisc pfifo_fast master bond0 qlen 1000

link/ether 00:15:17:48:79:c0 brd ff:ff:ff:ff:ff:ff

5: __tmp204226134: mtu 1500 qdisc noop qlen 1000

link/ether 00:1d:09:0b:3f:9b brd ff:ff:ff:ff:ff:ff

6: bond0: mtu 1500 qdisc noqueue

link/ether 00:15:17:48:79:c0 brd ff:ff:ff:ff:ff:ff

7: sit0: mtu 1480 qdisc noop

link/sit 0.0.0.0 brd 0.0.0.0





La carte en 5, qui est censé être eth1 apparait en tmp.



Question : C'est quoi ce truc ?



Toute aide sera bienvenue car mon serveur est en prod dans quelques jours ...



Merci d'avance

> Lire le message (8 commentaires, moyenne: 1,1).  

Vous avez demandé le commentaire #893625.

kudzu

Posté par bubar () le 29/12/2007 à 15:15. (lien). Évalué à 2.

chkconfig --del kudzu

le renommage sauvage des interfaces est une spécialité kudzu

(autre piste : si server NFS et si reuetes clientes incessantes vers points de montage inexistants (autoumont clients pas à jour par exemple) : alors le kernel redhat n' est pas fichu de fermer les sockets... après qq centaines, le système a du mal (...) alors si 1000 sont demandés, tu vois ce qui peux se passer ?)

[ Répondre ]

  • [^]Re: kudzu

    Posté par ArLouarn Mog () le 04/01/2008 à 10:55. (lien). Évalué à 1.

    Salut,

    Je suis toujours sur mon problème de freeze ssh. J'ai supprimé kudzu mais le freeze est toujours là.

    J'ai parmi mes modules chargés, ceux qui correspondent à iptables et ip6tables. Je n'arrive pas à les enlever (iptables et ip6tables sont arrêtés). J'ai fouillé sur le net et vérifié dans le fichier de config dans /boot, avec la commande suivante:
    grep "CONFIG_MODULE_FORCE_UNLOAD" /boot/config-$(uname -r), ce qui me renvoie:

    # CONFIG_MODULE_FORCE_UNLOAD is not set

    Question : est ce que je peux changer à chaud cette ligne ? Suis je obligé de redémarré mon serveur ?

    Enfin, que faut il mettre précisément dans le sshd_config pour que la connexion cliente ssh ne tombe jamais ?

    Merci

    [ Répondre ]

    [^]Re: kudzu

    Posté par ArLouarn Mog () le 04/01/2008 à 11:08. (lien). Évalué à 1.

    Salut,

    Je suis toujours sur mon problème de freeze ssh. J'ai supprimé kudzu mais le freeze est toujours là.

    J'ai parmi mes modules chargés, ceux qui correspondent à iptables et ip6tables. Je n'arrive pas à les enlever (iptables et ip6tables sont arrêtés). J'ai fouillé sur le net et vérifié dans le fichier de config dans /boot, avec la commande suivante:
    grep "CONFIG_MODULE_FORCE_UNLOAD" /boot/config-$(uname -r), ce qui me renvoie:

    # CONFIG_MODULE_FORCE_UNLOAD is not set

    Question : est ce que je peux changer à chaud cette ligne ? Suis je obligé de redémarré mon serveur ?

    Enfin, que faut il mettre précisément dans le sshd_config pour que la connexion cliente ssh ne tombe jamais ?

    Merci

    [ Répondre ]

    • [^]bonding ?

      Posté par stillbsd () le 06/01/2008 à 01:03. (lien). Évalué à 1.

      Salut,

      As-tu essayé de virer le bonding temporairement, afin de savoir si c'est lui qui est la cause du problème de freeze réseeau ?

      [ Répondre ]

      • [^]Re: bonding ?

        Posté par ArLouarn Mog () le 11/01/2008 à 11:57. (lien). Évalué à 1.

        Effectivement sans bonding ,ca va mieux. je tombe à du 0% de perte pour un ping par exemple.

        je continue a fouiller

        [ Répondre ]

      [^]Re: kudzu

      Posté par stillbsd () le 08/01/2008 à 17:07. (lien). Évalué à 1.

      Re-salut,

      Regarde ce thread, pour "stabiliser" ton bonding :
      http://forums11.itrc.hp.com/service/forums/questionanswer.do(...)

      [ Répondre ]

      • [^]Re: kudzu

        Posté par ArLouarn Mog () le 11/01/2008 à 12:20. (lien). Évalué à 1.

        bon .. ca rame toujours ...

        cat /etc/modprobe.conf
        alias eth0 bnx2

        #alias eth1 bnx2

        alias eth2 e1000

        #alias eth3 e1000

        alias scsi_hostadapter megaraid_sas

        alias scsi_hostadapter1 usb-storage

        alias bond0 bonding

        options bond0 mode=1 miimon=100 primary=eth0

        cat /etc/sysconfig/network-scripts/ifcfg-eth0

        DEVICE=eth0

        BOOTPROTO=none

        HWADDR=00:1d:09:0b:3f:99

        ONBOOT=yes

        SLAVE=yes

        MASTER=bond0

        cat /etc/sysconfig/network-scripts/ifcfg-eth2

        DEVICE=eth2

        BOOTPROTO=none

        HWADDR=00:15:17:48:79:c0

        ONBOOT=yes

        SLAVE=yes

        MASTER=bond0

        cat /etc/sysconfig/network-scripts/ifcfg-bond0

        ONBOOT=yes

        DEVICE=bond0

        BOOTPROTO=none

        IPADDR=192.168.22.3

        NETWORK=192.168.22.0

        NETMASK=255.255.255.0

        BROADCAST=192.168.22.255

        GATEWAY=192.168.22.1


        bref ....

        [ Répondre ]

        • [^]Re: kudzu

          Posté par stillbsd () le 14/01/2008 à 18:45. (lien). Évalué à 1.

          Tu as essayé de "réactiver" tes 2 autres interfaces dans /etc/modprobe.conf ? Et tu crées un fichier ifcfg-eth1 et un autre ifcfg-eth3, en mettant seulement les lignes ONBOOT=yes et leur adresse MAC (HWADDR) ?

          Essaies peut-être aussi d'enlever la directive HWADDR= de tous les fichiers ifcfg-eth* .

          -> Le but étant que ip link list te nomme correctement toutes tes interfaces.

          * Si tu as un serveur Dell PowerEdge 2950 server ou un HP ProLiant BL480c G1 server, regarde cette page qui parle de problèmes de nommage de cartes sur ces serveurs :
          http://www.cyberciti.biz/tips/howto-fix-rhel-centos-nic-orde(...)

          * Regarde aussi si tes interfaces sont au moins en 100 Mbits, avec ethtool <nom_interface> .

          * Pour dissocier les problèmes de perfs réseau d'avec un problème de configuration du bonding, désactive le
          ->
          Tu déplaces tous tes fichiers ifcfg-eth* et ifcfg-bond0 dans un répertoire séparé, puis tu arrêtes le réseau : ifdown -a.
          Puis tu copies le fichier sauvegardé ifcfg-bond0 dans ifcfg-eth0, renommes le DEVICE en eth0 puis , tu relances : ifup -a

          Si tu observes toujours des problèmes de déconnexions réseau, regarde au niveau de la configuration de la carte (vitesse, autonégociation, ...). Essaie de changer de driver ...

          Si tu n'as pas de problèmes de déconnexions sans le bonding, le problème vient de lui. Penses à te mettre au dernier niveau du kernel de Red Hat (de plus, ils en sont à la RHEL 5.1 en ce moment).

          [ Répondre ]