Cluster de 132 machines sous Linux

Posté par  (site web personnel) . Modéré par Franck Yvonnet.
Étiquettes : aucune
0
13
fév.
2002
Technologie
La société RackSaver(TM) a mis au point un cluster de 132 machines bi-Athlon MP (264 Athlon MP donc) sous Linux, avec 132 Go de mémoire et 8 To pour espace de stockage. La bête a été conçue pour l'université de Santa Cruz en Californie afin d'étudier et de modéliser le système planétaire Epsilon Andromède qui pourrait receler un système solaire semblable au notre.

Ce super-ordinateur possède une puissance de calcul supérieure à 300 gigaflops, et se prénomme "UpsAnd" (pour Upsilon Andromedae Planetary System). Cette machine se hisse à la 100ème place en terme de performance.

Aller plus loin

  • # Juste pour info

    Posté par  . Évalué à 10.

    La société CGG (Compagnie Générale de Geophysique) à un cluster de 1024 noeuds bi-pro
    * 1024 PIII 1 GHz
    * 1024 PIII 1,13 GHz
    * 1024 Go de RAM
    * 39 To de stockage
    Et bien sûr tout cela sous Linux ..
    Photos de la moitié du cluster : http://adequat.c2a.fr/special/photo_cluster(...)
    • [^] # Re: Juste pour info

      Posté par  (site web personnel) . Évalué à -5.

      Chouettes photos.

      Par contre, faudrait leur dire de corriger le "Qu'elles que uns des serveurs avant montage" sur ladite page :).
    • [^] # Re: Juste pour info

      Posté par  . Évalué à 10.

      sympa :) et ca utilise koi comme carte reseau?

      Le seul probleme dans l'utilisation de PC pour faire des cluster c'est au niveau du reseau
      en effet le solution disponibles son pas extremement satisfesantes...
      par exemple pour du gigabit ethernet faut du pci 64 bits et encore ca reste de l'ethernet...
      en fin de compte les architecture NUMA comme les sequant (des proc par paquet de 8 relie en fibre) etaient tres bien mais bon faudrait voir ce qu'on peut faire maintenant
      de toute facon on traine toujour l'architecture des chip intel (pas d'utilisation du crossbow comme sur les vieilles sgi) qui castrent un peu les perfo..
      • [^] # Re: Juste pour info

        Posté par  . Évalué à 8.

        Ici les machines sont en 100M et chaque rack est relié en giga a un switch ou est relié le serveur maître.
        Mais bien sûr dans d'autres cas de configurations l'ethernet montre ses points faibles et c'est pour ca que l'on met du Myrinet ou du SCI ..
    • [^] # Re: Juste pour info

      Posté par  . Évalué à 0.

      et qu'elle est la puissance de la bête?
    • [^] # Re: Juste pour info

      Posté par  . Évalué à 2.

      Juste une petite question : pourquoi deux types de pentium (fréquence différente) ?
      • [^] # Re: Juste pour info

        Posté par  . Évalué à 1.

        en fait le cluster a été installé en deux parties. C'est pour ca qu'il y a deux freq de proc ..
  • # top 500

    Posté par  . Évalué à 10.

    Ca fait depuis un moment que Linux envahi le top 500 par l'intermédiaire de clusters.

    Pour rêver un peu: http://top500.org/list/2001/11/(vous(...) avez vu ce que fait le 12° avec "seulement" 128 processeurs?)

    Trop dommage qu'ils ne mettent pas les OS dans leurs stats.
    • [^] # Re: top 500

      Posté par  . Évalué à 0.

    • [^] # Re: top 500

      Posté par  . Évalué à 4.

      bof de toute facon sur les grosses becanes c'est pas l'os qui conpte mais l'efficacite de la repartition du calcul...
      de toute facon la plus part du temps c'est des os reduit a la plus simple expression...

      (comment ca je peut pas brancher mon pad sur le cluster??? et comment je joue a frozen buble moi???)
      • [^] # Re: top 500

        Posté par  . Évalué à 1.

        Non, là tu te trompes
        L'os est tout aussi important que les librairies de communications (dont l'implantation dépend de l'os aussi!) autant pour la stabilité (planter au bout de 200 heures de calcul n'est pas très satisfaisant) que pour l'administration, ou pour l'efficacité du code généré ou pour la gestion des IO ("sortir" les gigantesques résultats de ces bécanes est au moins aussi important que de les obtenir) et les ordinateurs scientifiques n'ont pas une os "réduit à la plus simple expression"
    • [^] # Re: top 500

      Posté par  . Évalué à 3.

      Ca fait depuis un moment que Linux envahi le top 500
      Justement, dans la liste je vois des HP Superdome par dizaines, mais pas beaucoup de machines qui pourraient-être des clusters de PC, à part l'entrée n°320 : "Dell PowerEdge Cluster Windows 2000" qui n'est pas manifestement sous Linux.

      Alors les clusters Linux, ils sont tous avec des processeurs ALPHA, ou bien ils sont trop peu puissant pour figurer dans le TOP 500 (on en trouve peut-être plus dans le TOP 1000)
      • [^] # Re: top 500

        Posté par  . Évalué à 3.

        Ouais. Y'a quand même l'entrée N°103, par exemple, manifestement sous Linux.
        • [^] # Re: top 500

          Posté par  . Évalué à 1.

          Europa – Render/Compute Nodes
          Achieved 0.3 TF on Linpack Benchmark
          Ranked 103 on November, 2001 Top500 list
          128 Dell Precision 530 workstations
          with dual 1.7 GHz Pentium-4 Xeon CPUs, 1 GB RDRAM
          Myrinet 2000 interconnect
          Linux and Windows operating systems
  • # c'est pas de l'ethernet

    Posté par  . Évalué à 10.

    un point interessant les machines ne communiquent pas par ethernet mais par des cartes d'interconnexion "SCI" specialenemt concues pour les clusters... je connaissait pas.
    • [^] # Re: c'est pas de l'ethernet

      Posté par  . Évalué à 5.

      il y a aussi dans le même type de carte les cartes Myrinet
      • [^] # Re: c'est pas de l'ethernet

        Posté par  . Évalué à 10.

        SCI c'est pas tout a fait comme Myrinet. Myrinet c'est surtout axe passage de message (MPI, PVM..). Alors que pour SCI, l'idee c'est plus oriente memoire partagee (ie tu accedes a une adresse memoire qui se trouve etre sur une machine distante !). Bien sur il est possible d'implementer une lib de passage de message au dessus de SCI ou une memoire virtuelle partagee au dessus de Myrinet.

        D'autre part, je crois que SCI est utilise dans les machines SUN haut de gamme pour faire des architectures NUMA (non uniform memory access).

        Dans les deux cas c'est des cartes haut de gamme (2000 euros / machines). Amortir ce cout par des machines SMP parait intelligent.

        Dommage qu'ils n'affichent pas le prix de la config !
        • [^] # Re: c'est pas de l'ethernet

          Posté par  . Évalué à 4.

          Ce n'est pas tout a fait exacte. Myrinet tout comme Dolphin/SCI sont des interfaces reseau haut debit a faible latence dedies aux applications parraleles a grain fin. Ce sont deux technologies tres comparables en terme de prix, de perf et de fonctionnalites. Sur ces couche physique se greffe ensuite des interface logiciels comme MPI (mpi-gm chez myricom et scaMP chez SCI...). Une difference assez fondamentale est que l'implementation de MPI de SCI est fermé alors qu'elle est libre chez myricom.
          Tout cela fonctionne bien sur tres bien sur des PC sous linux...

          Sylvain
          • [^] # Re: c'est pas de l'ethernet

            Posté par  . Évalué à 5.

            Non je ne suis pas d'accord. Myrinet et SCI sont des technos differentes et ont des fonctionnalites differentes, meme si le marche derriere est le meme ! SCI offre notamment un reseau a capacite d'adressage, ca signifie qu'un processeur peut acceder via des instructions load/store habituelles a la memoire d'un noeud different, et ce directement(sans passer par le systeme mais en passant par le bus PCI). Sinon en terme de prix c'est comparable (et tres/trop? cher).

            Apres implementer dessus SCI une interface logiciel de type passage de message (MPI), c'est pour pouvoir faire tourner la majeure partie des applis paralleles. Ainsi je dirais que Myrinet est taille pour MPI alors que SCI ne l'est pas forcement. Il faut dire aussi que Myrinet et beaucoup plus repandu que SCI sur les clusters linux.
    • [^] # t'es sur ?

      Posté par  . Évalué à 10.

      il y'a un ethernet dédié aux clusters justement, c'est un gabarit adapté avec des distances très courtes (genre 20 cm à la place des 150 m) et un max de débit (genre ethernet gigabit qu'on fait passer sur du twisté blindé car cables courts et adaptés).

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.