Voilà, je suis tombé le site de Linux-ha.org [1], et comme je travaille en stage sur un cluster de serveur mail (même que j'ai décidé de prolonger le stage chez moi, parce que c'est marrant).
Mon maître de stage m'a dit : oui ça, on aimerait bien que ça soit inclu dans la distrib.
Donc je creuse le sujet. Je suis tombé sur une page décrivant en détail comment marchait un peu tout ça ([2]).
Malheureusement j'ai beau tout parcourir de partout, il me manque une chose qui m'intrigue. Ils décrivent ce qui se passe quand on arrête proprement les serveurs (notification au noeud élu, tout ça ... et exit(0)).
Mais si un noeud plante tout simplement (un kernel panic devrait faire l'affaire), que se passe-t-il ? Figure-t-il toujours dans la table des noeuds ? Comment est-il écarté de celle-ci ?
Notamment, si c'est le noeud principal.
Par exemple, on a 10 machines en cluster avec HA, tous ont leur propre IP interne, et une ip globale (serveur mail ou web ou ce que vous voulez).
L'ip globale est attribuée par une élection entre tous, à une seule machine. Cette machine plante. Donc l'ip globale est "perdue". Comment le cluster la récupère et réassigne à une autre machine ?
[1] http://www.linux-ha.org/(...)
[2] http://linuxha.trick.ca/ClusterResourceManagerDaemon(...)
# Relis bien...
Posté par Bilbo . Évalué à 1.
Celui que tu as choisi comme exemple fonctionne comme du HeartBeat pour l'élection du ClusterManager.
Si un noeud ne reçoit plus les messages du coordinateur, il suppose qu'il est mort et on procède à une nouvelle élection. L'avantage c'est que ca monte bien en cas de panne. Le problème c'est que si tu as juste un problème de connectique entre les noeuds et pas avec le routeur, ça risque d'être l'anarchie... d'où le channel bonding pour éviter ça au maximum.
Linux Mag avait sorti un hors série spécial HA il y a quelques mois, je te le conseille, il est très didactique. J'ai découvert plein de choses... ==> http://www.linuxmag-france.org/produit.php?produit=163(...)
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.