Forum Linux.redhat RHEL 5 et Heartbeat 2

Posté par  .
Étiquettes :
0
31
juil.
2008
Bonjour à tous

Je suis en train de mettre en place heartbeat (avec le rpm suivant- j'ai laissé tomber le tar car c'est pire -heartbeat-2.1.3-23.1.x86_64.rpm )sur deux serveurs apache. Et j'ai donc un souci.

voici ma configuration

ha.cf
bcast eth0

debugfile /var/log/ha-debug
logfile /var/log/ha-log
logfacility local0

keepalive 2
deadtime 10
warntime 6
initdead 60

udpport 694
node noeud1
node noeud2
auto_failback off
apiauth mgmtd uid=root
respawn root /usr/lib64/heartbeat/mgmtd -t

haresources
noeud1 IPaddr2::192.168.2.90/24/eth0 apache2

Donc :
- je n'arrive pas à faire monter l'adresse IP virtuelle. Si je lance Ipaddr manuellement, le système me dit que tout est ok mais je ne vois aucune nouvelle interface qui apparait.
- si je mets crm yes dans le ha.cf, mon serveur reboote en boucle (c'est le cas actuellement)

Je précise que j'ai pas de iptables ni de selinux activé. Que j'ai modifié moults fois la ressource IPaddr en IPaddr2, IPaddr::monip etc etc mais rien n'y fait. De plus, si je demande son statut à ha, il me dit qu'il est en cours de fonctionnement (heartbeat OK [pid 8964 et al] is running on noeud2 [noeud2]...)mais je ne vois aucun port 694 ouvert ....

Bref, ca merdoie et je commence à être agacé, donc si quelqu'un pouvait juste me dire ce qui ne va pas, ce serait sympa
  • # idées simples

    Posté par  . Évalué à 1.

    Bonsoir,

    Je n'en ai jamais configuré, mais bon je lance quelques idées :-)

    * As tu vérifié ce que dit la log : /var/log/ha-log ?

    * Tu utilises bien :
    ip addr show
    pour vérifier que l'IP virtuelle est créée ?

    * Par ailleurs, dans les docs qui trainent sur le Net, ils disent de faire attention à ce que le nom des nodes soient bien le résultat de uname -n .

    * Enfin as-tu essayé de commenter ces 2 lignes :
    apiauth mgmtd uid=root

    respawn root /usr/lib64/heartbeat/mgmtd -t

    Bonne chance en tout cas.
    • [^] # Re: idées simples

      Posté par  . Évalué à 1.

      Merci.

      J'ai vérifié, et j'ai quelques erreurs un peu partout, mais je vois bien dans les logs que l'ip virtuelle est montée mais avec un ip addr show, voici ce que j'obtiens :
      1: lo: <LOOPBACK,UP,LOWER_UP> mtu 16436 qdisc noqueue
      link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
      inet 127.0.0.1/8 scope host lo
      inet6 ::1/128 scope host
      valid_lft forever preferred_lft forever
      2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast qlen 1000
      link/ether 00:1e:c9:bb:ca:f0 brd ff:ff:ff:ff:ff:ff
      inet 192.168.2.88/24 brd 192.168.2.255 scope global eth0
      inet6 fe80::21e:c9ff:febb:caf0/64 scope link
      valid_lft forever preferred_lft forever
      3: eth1: <BROADCAST,MULTICAST> mtu 1500 qdisc noop qlen 1000
      link/ether 00:1e:c9:bb:ca:f1 brd ff:ff:ff:ff:ff:ff
      4: sit0: mtu 1480 qdisc noop
      link/sit 0.0.0.0 brd 0.0.0.0

      j'ai bien ca dans le haresources:
      noeud1 IPaddr2 192.168.2.90/24/eth0

      Le log avec une hearbeat restart:

      heartbeat[14349]: 2008/08/01_12:04:16 info: Heartbeat shutdown in progress. (14349)
      heartbeat[15113]: 2008/08/01_12:04:16 info: Giving up all HA resources.
      ResourceManager[15126]: 2008/08/01_12:04:16 info: Releasing resource group: noeud1 IPaddr2 192.168.2.90/24/eth0
      ResourceManager[15126]: 2008/08/01_12:04:16 info: Running /etc/ha.d/resource.d/IPaddr 192.168.2.90/24/eth0 stop
      IPaddr[15166]: 2008/08/01_12:04:16 INFO: Success
      ResourceManager[15126]: 2008/08/01_12:04:16 info: Running /etc/ha.d/resource.d/IPaddr2 stop
      ResourceManager[15126]: 2008/08/01_12:04:16 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr2
      ResourceManager[15126]: 2008/08/01_12:04:17 info: Retrying failed stop operation [IPaddr2]
      ResourceManager[15126]: 2008/08/01_12:04:17 info: Running /etc/ha.d/resource.d/IPaddr2 stop
      ResourceManager[15126]: 2008/08/01_12:04:17 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr2
      ResourceManager[15126]: 2008/08/01_12:04:18 info: Retrying failed stop operation [IPaddr2]
      ResourceManager[15126]: 2008/08/01_12:04:18 info: Running /etc/ha.d/resource.d/IPaddr2 stop
      ResourceManager[15126]: 2008/08/01_12:04:18 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr2
      ResourceManager[15126]: 2008/08/01_12:04:19 info: Retrying failed stop operation [IPaddr2]
      ResourceManager[15126]: 2008/08/01_12:04:19 info: Running /etc/ha.d/resource.d/IPaddr2 stop
      ResourceManager[15126]: 2008/08/01_12:04:19 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr2
      ResourceManager[15126]: 2008/08/01_12:04:20 info: Retrying failed stop operation [IPaddr2]
      ResourceManager[15126]: 2008/08/01_12:04:20 info: Running /etc/ha.d/resource.d/IPaddr2 stop
      ResourceManager[15126]: 2008/08/01_12:04:20 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr2
      ResourceManager[15126]: 2008/08/01_12:04:21 info: Retrying failed stop operation [IPaddr2]
      ResourceManager[15126]: 2008/08/01_12:04:21 info: Running /etc/ha.d/resource.d/IPaddr2 stop
      ResourceManager[15126]: 2008/08/01_12:04:21 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr2
      ResourceManager[15126]: 2008/08/01_12:04:22 info: Retrying failed stop operation [IPaddr2]
      ResourceManager[15126]: 2008/08/01_12:04:22 info: Running /etc/ha.d/resource.d/IPaddr2 stop
      ResourceManager[15126]: 2008/08/01_12:04:22 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr2
      ResourceManager[15126]: 2008/08/01_12:04:23 info: Retrying failed stop operation [IPaddr2]
      ResourceManager[15126]: 2008/08/01_12:04:23 info: Running /etc/ha.d/resource.d/IPaddr2 stop
      ResourceManager[15126]: 2008/08/01_12:04:23 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr2
      ResourceManager[15126]: 2008/08/01_12:04:24 info: Retrying failed stop operation [IPaddr2]
      ResourceManager[15126]: 2008/08/01_12:04:24 info: Running /etc/ha.d/resource.d/IPaddr2 stop
      ResourceManager[15126]: 2008/08/01_12:04:24 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr2
      ResourceManager[15126]: 2008/08/01_12:04:25 info: Retrying failed stop operation [IPaddr2]
      ResourceManager[15126]: 2008/08/01_12:04:25 info: Running /etc/ha.d/resource.d/IPaddr2 stop
      ResourceManager[15126]: 2008/08/01_12:04:25 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr2
      ResourceManager[15126]: 2008/08/01_12:04:26 info: Retrying failed stop operation [IPaddr2]
      ResourceManager[15126]: 2008/08/01_12:04:26 info: Running /etc/ha.d/resource.d/IPaddr2 stop
      ResourceManager[15126]: 2008/08/01_12:04:26 ERROR: Return code 1 from /etc/ha.d/resource.d/IPaddr2
      ResourceManager[15126]: 2008/08/01_12:04:26 ERROR: Resource script for IPaddr2 probably not LSB-compliant.
      ResourceManager[15126]: 2008/08/01_12:04:26 WARN: it (IPaddr2) MUST succeed on a stop when already stopped
      ResourceManager[15126]: 2008/08/01_12:04:26 WARN: Machine reboot narrowly avoided!
      heartbeat[15113]: 2008/08/01_12:04:26 info: All HA resources relinquished.
      heartbeat[14349]: 2008/08/01_12:04:28 info: killing HBFIFO process 14351 with signal 15
      heartbeat[14349]: 2008/08/01_12:04:28 info: killing HBWRITE process 14352 with signal 15
      heartbeat[14349]: 2008/08/01_12:04:28 info: killing HBREAD process 14353 with signal 15
      heartbeat[14349]: 2008/08/01_12:04:28 info: Core process 14353 exited. 3 remaining
      heartbeat[14349]: 2008/08/01_12:04:28 info: Core process 14352 exited. 2 remaining
      heartbeat[14349]: 2008/08/01_12:04:28 info: Core process 14351 exited. 1 remaining
      heartbeat[14349]: 2008/08/01_12:04:28 info: noeud1 Heartbeat shutdown complete.
      heartbeat[15690]: 2008/08/01_12:04:49 info: Version 2 support: false
      heartbeat[15690]: 2008/08/01_12:04:49 WARN: Logging daemon is disabled --enabling logging daemon is recommended
      heartbeat[15690]: 2008/08/01_12:04:49 info: **************************
      heartbeat[15690]: 2008/08/01_12:04:49 info: Configuration validated. Starting heartbeat 2.1.3
      heartbeat[15691]: 2008/08/01_12:04:49 info: heartbeat: version 2.1.3
      heartbeat[15691]: 2008/08/01_12:04:49 info: Heartbeat generation: 1217402077
      heartbeat[15691]: 2008/08/01_12:04:49 info: glib: ucast: write socket priority set to IPTOS_LOWDELAY on eth0
      heartbeat[15691]: 2008/08/01_12:04:49 info: glib: ucast: bound send socket to device: eth0
      heartbeat[15691]: 2008/08/01_12:04:49 info: glib: ucast: bound receive socket to device: eth0
      heartbeat[15691]: 2008/08/01_12:04:49 info: glib: ucast: started on port 694 interface eth0 to 192.168.2.89
      heartbeat[15691]: 2008/08/01_12:04:49 info: G_main_add_TriggerHandler: Added signal manual handler
      heartbeat[15691]: 2008/08/01_12:04:49 info: G_main_add_TriggerHandler: Added signal manual handler
      heartbeat[15691]: 2008/08/01_12:04:49 info: G_main_add_SignalHandler: Added signal handler for signal 17
      heartbeat[15691]: 2008/08/01_12:04:49 info: Local status now set to: 'up'

      je cherche de mon côté pour l'erreur code 1 ...

      sinon .. je ne sais plus quoi faire
      • [^] # Re: idées simples

        Posté par  . Évalué à 1.

        Oui regarde pourquoi ce script retourne systématiquement une erreur :
        /etc/ha.d/resource.d/IPaddr2
        Tu peux le tracer à la main avec :
        sh -x /etc/ha.d/resource.d/IPaddr2 stop

        Ca parait étrange que IPaddr stop puis IPddr2 stop soient exécutés. Le 1er enlève l'IP, et le 2nd ne le peut plus, ça parait compréhensible.

        Bon sinon, essaie de copier la conf du Mr :
        http://blog.info16.fr/index.php?post/2007/08/21/18-haute-dis(...) .
        Il met :
        node1 IPaddr::
        dans le fichier /etc/ha.d/haresources .

        Et utilise un fichier authkeys.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.