Forum général.général Haute disponibilité : comment ça marche ?

Posté par  .
Étiquettes : aucune
0
20
sept.
2004
Voilà, je suis tombé le site de Linux-ha.org [1], et comme je travaille en stage sur un cluster de serveur mail (même que j'ai décidé de prolonger le stage chez moi, parce que c'est marrant).

Mon maître de stage m'a dit : oui ça, on aimerait bien que ça soit inclu dans la distrib.
Donc je creuse le sujet. Je suis tombé sur une page décrivant en détail comment marchait un peu tout ça ([2]).
Malheureusement j'ai beau tout parcourir de partout, il me manque une chose qui m'intrigue. Ils décrivent ce qui se passe quand on arrête proprement les serveurs (notification au noeud élu, tout ça ... et exit(0)).
Mais si un noeud plante tout simplement (un kernel panic devrait faire l'affaire), que se passe-t-il ? Figure-t-il toujours dans la table des noeuds ? Comment est-il écarté de celle-ci ?
Notamment, si c'est le noeud principal.

Par exemple, on a 10 machines en cluster avec HA, tous ont leur propre IP interne, et une ip globale (serveur mail ou web ou ce que vous voulez).
L'ip globale est attribuée par une élection entre tous, à une seule machine. Cette machine plante. Donc l'ip globale est "perdue". Comment le cluster la récupère et réassigne à une autre machine ?












[1] http://www.linux-ha.org/(...)
[2] http://linuxha.trick.ca/ClusterResourceManagerDaemon(...)
  • # Relis bien...

    Posté par  . Évalué à 1.

    Tout d'abord, il faut que tu saches qu'il existe plusieurs systèmes de HA. Celui ci n'est qu'un parmi d'autres...

    Celui que tu as choisi comme exemple fonctionne comme du HeartBeat pour l'élection du ClusterManager.

    # The DC Timer
    If any node goes without receiving any DC_Heartbeats in the interval in which (currently) 4 should have been received, it means that there is no DesignatedCoordinator and an election is required.


    Si un noeud ne reçoit plus les messages du coordinateur, il suppose qu'il est mort et on procède à une nouvelle élection. L'avantage c'est que ca monte bien en cas de panne. Le problème c'est que si tu as juste un problème de connectique entre les noeuds et pas avec le routeur, ça risque d'être l'anarchie... d'où le channel bonding pour éviter ça au maximum.

    Linux Mag avait sorti un hors série spécial HA il y a quelques mois, je te le conseille, il est très didactique. J'ai découvert plein de choses... ==> http://www.linuxmag-france.org/produit.php?produit=163(...)

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.