XtreemOS : utiliser une grille de calculateurs comme un PC

Posté par  . Modéré par Jaimé Ragnagna.
Étiquettes :
0
19
déc.
2007
Science
XtreemOS vise à concevoir, réaliser et promouvoir un système d’exploitation fondé sur Linux pour les grilles du futur.

Les grilles de calcul permettent à des organisations de mettre en commun leurs ordinateurs et d’accroître ainsi considérablement leur capacité de calcul. Néanmoins, utiliser, gérer et programmer les grilles de calcul est très complexe car les ressources ainsi mises en commun sont distribuées, hétérogènes, administrées de façon indépendante et reliées par des réseaux aux performances variables. Les outils développés pour les faire fonctionner, comme Globus, sont complexes d’utilisation, notamment parce qu’ils s’appuient sur des systèmes d’exploitation qui ne sont pas conçus pour gérer des ressources distribuées et versatiles.

En partie financé par la Commission Européenne, le projet de recherche européen XtreemOS développe un système d’exploitation pour administrer, programmer et utiliser facilement de très grandes collections de ressources réparties sur grille. L’idée sous-jacente est de rendre une grille aussi facile à utiliser qu’un ordinateur traditionnel. Le système XtreemOS sera construit pour fonctionner sur des PC et des grappes de calculateurs (clusters) – fondé sur la technologie Kerrighed - et permettre l’accès aux ressources à partir de PDAs et de téléphones mobiles.

Le consortium XtreemOS est constitué de 19 partenaires académiques et industriels localisés en Europe pour la majorité et en Chine. Le logiciel conçu et réalisé dans le cadre du projet XtreemOS est fondé sur le système d’exploitation Linux et sera diffusé sous licence libre.

Les fonctionnalités principales de XtreemOS permettront :
  • d’assurer la protection des données, des applications et des ressources dans un environnement distribué, administré de manière décentralisée par différentes institutions ; tout en facilitant l’accès à ces entités pour les membres d’une organisation virtuelle ;
  • de s’auto-reconfigurer face aux défaillances des ordinateurs ou de liens du réseau et face à la dynamicité des grilles (une institution peut décider à tout moment d’ajouter ou de soustraire des ressources à une grille) ;
  • d’assurer l’exécution fiable des applications distribuées en dépit des fréquentes reconfigurations et défaillances pouvant survenir dans une grille ;
  • de gérer efficacement l’allocation des ressources et les accès aux données pour garantir de hautes performances aux applications.
En outre, le système d’exploitation XtreemOS est testé, dans son intégralité, grâce à un ensemble de 14 applications en grandeur réelle de différents secteurs (aéronautique, économie, biologie, etc.) ; ceci pour garantir que les besoins de l’utilisateur final sont bien prises en compte dans la conception, réalisation et validation du système. Les premières expériences seront réalisées sur la plate-forme expérimentale Grid5000. Des expériences sont envisagées sur une grille interconnectant des ressources de Grid 5000, de la grille des Pays-Bas DAS-3 et de la grille chinoise CNGrid.

Une première version du système sera diffusée au printemps 2008 alors que des prototypes des différents services du système sont d’ores et déjà implémentés et en cours d’intégration. Les deux dernières années du projet seront consacrées au développement de fonctionnalités avancées notamment concernant la robustesse et la sécurité du système. Notre ambition est de faire de XtreemOS un système d’exploitation de référence pour les grilles et de constituer une communauté d’utilisateurs et de développeurs.

Pour plus d’informations sur le projet XtreemOS la 2ème lettre d’information XtreemOS est en ligne. Contact : xtreemos-info chez irisa.fr


Données clefs du projet XtreemOS
  • Date de début : 1er juin 2006
  • Durée : 48 mois
  • Coordinateur scientifique : Dr. Christine Morin – INRIA Rennes Bretagne Atlantique (France)
  • 19 partenaires
  • Financement total : 30 M€ (dont 14,2 M€ de la Commission Européenne)

Aller plus loin

  • # gridOS

    Posté par  . Évalué à 1.

    à noter également un projet complémentaire à savoir le projet GridOS : http://www.eecs.umich.edu/~ppadala/research/gridos (un rapport sur le sujet à l'URL suivante http://citeseer.ist.psu.edu/666145.html).
  • # HA?

    Posté par  . Évalué à 2.

    J'ai un besoin un peu différent, alors je ne sais pas si on peut "travestir" une grille pour faire de la HA.

    Je m'explique :
    Pour le boulot, on se pose la question de virtualiser des serveurs (plus pour toucher à tout ça que pour des impératifs de prod).
    Bon l'ennui de ça, c'est que si la babasse contenant les serveurs crash, on est dans la merde.

    Donc je me suis renseigné sur la HA avec Xen/kvm. Bon c'est pas encore la simplicité même.
    Kvm par contre lui permet de dire "une vm <=> un processus".

    Je me demandais si on peut pas essayer d'utiliser une grille , on lance nos vm.
    A intervalle régulier des snapshots sont faits (comme ça existe pour certains systèmes de calcul où les threads stockent toutes leur données temporaires pour pouvoir faire une reprise en cas d'erreur).
    Si une machine tombe (ou est éteinte), la grille l'aperçoit puis relance les processus/snapshots qui étaient dessus.
    Si une machine est trop sollicité, elle migre un processus sur une machine moins sollicité.

    Bon le problème qui se pose en plus des problèmes avec des processus "normaux", c'est que vu que ce sont des serveurs, il faudra que les ips des vm suivent.

    Alors à votre avis : possible de les utiliser comme ça, ou faut mieux utiliser DRDB/Heartbeat etc... ?
    • [^] # Re: HA?

      Posté par  (site web personnel) . Évalué à 2.

      Alors à votre avis : possible de les utiliser comme ça, ou faut mieux utiliser DRDB/Heartbeat etc... ?

      bin en tout cas c'est un des axes que Bull présente pour AIX 6 (et les power6) pour la migration de vm : quand les deux serveurs sont up (donc pas du PRA [1]), un snapshot (à la begin backup de Oracle) peut être déplacé, ça dure le temps qu'il faut, puis le delta (un end backup à la Oracle) est ensuite transféré, pendant le transfert du snapshot les blocs mémoire mis à jour étant invalidés au fur et à mesure pour pouvoir être retransmis...

      Cela permet surtout de faire de la migration de tout un environnement (répartition de charge ou "place" à récupérer sur le serveur ou recopie d'un environnement de recette à environnement d'intégration/préproduction...), après pour les IP forcément ya des soucis de mac address (mais faudrait que je reprenne mes notes, il y avait une possibilité).
      Bon clairement, pour du PRA, le souci c'est que le serveur d'origine n'est plus présent... m'enfin je ne doute pas que cela pourra évoluer vers des bricolage à la live-DB que j'ai pu voir et que ce sera industrialisé dans quelques versions... et avec les réseaux 10 Gbits qui fleurissent déjà, ce n'est pas le temps de transfert qui sera le plus pénalisant (quoique en inter-site...).
      Bref, tout de suite il doit être possible de bricoler des choses et à l'avenir ce sera sans doute possible, même si je suis plus pour du load-balancing (actif-actif) quand il n'y a pas de persistance de données nécessaire (mais bon ça c'est le cas facile...).

      après le heartbeat, drdb c'est tout de même les outils qui te permettent d'identifier quand il est temps d'activer le "passif", ils perdureront sans doute ;-)

      [1] http://fr.wikipedia.org/wiki/Plan_de_continuit%C3%A9_d'activ(...)
      • [^] # Re: HA?

        Posté par  . Évalué à 1.

        Le sujet est en effet suivi par un grand nombre d'instituts aussi bien industriels qu'académiques.
        Une thèse[1] vient justement de débuter dans le projet XtreemOS sur l'intérêt des VMs (consolidation, sécurité, HA) pour les applications au niveau des grilles. Un premier rapport étudiant les caractéristiques majeures des VMs par rapport aux mécanismes fournis par les approches SSI est d'ores-et-déjà dispo [2] !

        [1] http://www.irisa.fr/paris/web/Member-Home-Pages/view-94.html (la page web devrait être mise à jour sous peu)
        [2] http://hal.inria.fr/inria-00196717/en/
    • [^] # Re: HA?

      Posté par  (Mastodon) . Évalué à 4.

      Si une machine tombe (ou est éteinte), la grille l'aperçoit puis relance les processus/snapshots qui étaient dessus.
      du côté de Exanodes, une solution de la socièté Seanodes ?
      ça à l' air complémentaire. (et les partenaires semblent proches de ceux de xtreemos hihihi :) )
      http://seanodes.com



      Si une machine est trop sollicité, elle migre un processus sur une machine moins sollicité.
      Xen (3.x) sait faire cela (presque) tout seul comme un grand, il me semble...

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.