Liens connexes

Dépêche modérée par

Dépêche éditée par

: La course au pétaflops se déroule sous Linux

Posté par patrick_g (page perso, ). Modéré le 25 mai 2008.
0
Avant la fin de cette année un superordinateur dépassera la barre mythique du pétaflops et cette machine fonctionnera avec le système d'exploitation GNU/Linux.

Alors que le franchissement du téraflops datait de 1996 avec le superordinateur Asci Red (4510 processeurs Pentium Pro cadencés à 200 MHz) nous voici, 12 ans plus tard, à la veille de franchir la marche supérieure, le pétaflops (un million de milliards de calculs par seconde).
Pour la première place au classement Top500 du mois prochain la course est donc engagée entre le Ranger du centre de calcul de l'université du Texas et le Roadrunner du laboratoire de Los Alamos.

> Lire la suite (62 commentaires, moyenne: 4,4).   [dépêche : 9977 caractères]

Les superordinateurs ont, depuis toujours, été la chasse gardée des systèmes d'exploitations exotiques spécialisés ou des Unix propriétaires. Par exemple ASCI Red utilisait un mélange de T O/S pour les entrées/sorties et de Cougar pour les noeuds de calcul. Cela signifie qu'ASCI Red reposait sur deux OS très spécialisés et non standards et qu'il était difficile de capitaliser sur une base commune de code quand il fallait changer d'architecture. Pourtant, à partir de 1999 et surtout depuis 2003, le système d'exploitation libre Linux a réussi une incroyable percée et il est en voie de remplacer complètement ses concurrents sur ce créneau très particulier. Lors du dernier classement Top 500 de novembre 2007 les machines fonctionnant avec l'OS libre représentaient plus de 85% du total ! On assiste donc à une standardisation de la composante OS dans les superordinateurs et, dans le rôle de ce standard, à un véritable plébiscite de Linux.
La course qui oppose le Ranger et le Roadrunner pour atteindre la première place du prochain classement sera donc, dans tous les cas, un succès pour Linux.

Ranger est une machine qu'on pourrait qualifier de classique puisqu'il s'agit d'un cluster de noeuds de calcul et qu'il n'y a qu'un seul type de microprocesseurs dans ces noeuds. Basé sur l'architecture Sun constellation, Ranger possède 15744 processeurs quadri-coeurs Barcelona cadencés à 2 GHz (cela représente donc 62976 coeurs de la famille Opteron d'AMD). Le système d'exploitation est basé sur la distribution CentOS, une Red Hat Linux rebaptisée et recompilée depuis les sources, et le noyau est le 2.6.18.8 en version x86_64. La vitesse de pointe est de 504 téraflops et cette machine est donc bien placée pour prendre la première place dans le prochain classement Top 500 du mois prochain...à moins que Roadrunner ne la coiffe au poteau !

Alors que Ranger est une machine vraiment traditionnelle on peut dire que l'architecture de Roadrunner est beaucoup plus intéressante. Au lieu de n'employer que des processeurs x86 classiques, Roadrunner mélange des opterons double-coeur d'AMD avec des microprocesseurs Cell d'IBM. C'est l'approche "Hybrid Computing" et cela consiste à coupler des noeuds d'Opterons qui se chargent des entrées/sorties, de la communication et des calculs légers avec des Cells qui s'occupent eux des calculs intensifs et répétitifs.

Comme vous le savez sans doute le Cell est lui-même doté d'une architecture très originale. Elle est divisée en deux grands blocs fonctionnels : Tout d'abord le PPE (PowerPC Processing Element) qui est une unité généraliste double-thread de type PowerPC classique. Ensuite on trouve les SPU (Synergistic Processing Units) qui sont huit unités vectorielles 128 bits possédant chacune une mémoire locale de 256 Ko accessible par le programmeur. Ce mode d'accès est insolite car d'habitude on trouve des mémoires caches qui sont gérées automatiquement par le processeur sans que le programmeur ne puisse avoir la main sur le chargement des données. La technique de la mémoire locale permet une bien plus grande souplesse et ouvre de grandes possibilités d'optimisations pour les auteurs des programmes.

Développé par une alliance entre IBM, Toshiba et Sony le microprocesseur Cell a tout de suite intéressé le milieu du calcul scientifique à hautes performances. Les chercheurs ont voulu savoir quel était le potentiel du Cell et une comparaison détaillée a été effectuée avec des microprocesseurs classiques comme l'Opteron, des microprocesseurs VLIW comme l'Itanium et enfin des microprocesseurs purement vectoriels comme ceux du Cray X1E. Le résultat de cette comparaison c'est que le Cell écrabouille ses concurrents mais que la précision du calcul des nombres à virgule à 32 bits (bien suffisante pour le marché du jeu vidéo) constitue une limitation sévère.
C'est pour résoudre ce problème qu'IBM a sorti en début d'année la version PowerXCell 8i qui propose une précision en 64 bits pour les nombres flottants. La page 12 de cette présentation détaille les améliorations supplémentaires du powerXCell 8i (passage à la mémoire DDR2, gestion de 16 Go de mémoire par puce au lieu de 2, réduction de la latence de 13 cycles à 9 cycles, etc). Le résultat brut c'est que la performance d'une puce Cell traditionnelle était de 25 gigaflops en double précision (64 bits donc) alors qu'avec le Cell 8i on passe à 102 gigaflops.
Pour construire Roadrunner la recette est donc simple: On prend une carte LS21 contenant deux Opterons dual-coeur cadencés à 1,8 GHZ et deux cartes QS22 contenant chacune deux Cell 8i cadencés à 3,2 GHz. Ces trois cartes forment une "TriBlade" et on en entasse 180 dans un gros rack nommé une "Connected Unit". Chacune de ces "Connected Unit" possède également 24 Opteron double-coeur à 2,6 GHz pour gérer les entrées/sorties ce qui fait qu'elle contient en tout 384 Opterons et 720 Cells.
Maintenant il n'y a plus qu'à relier 18 de ces "Connected Unit" pour avoir Roadrunner ! Si vous vous amusez à faire les multiplications cela représente 13824 coeurs Opteron et 12960 Cell 8i et, si on ajoute les noeuds de disques, on obtient un monstre qui consomme quand même la bagatelle de 3,9 mégawatts.
La puissance en pointe sera de plus de 1,6 pétaflops et, pour le test LINPACK qui conditionne le classement du Top500, la puissance soutenue sera de 1 pétaflops. La vitesse extraordinaire du Cell est bien illustrée par le fait qu'en dépit d'une quasi-égalité en nombre de coeurs la répartition de la capacité de calcul est très inégalitaire. Sur les plus de 1,6 pétaflops il y en a 1,3 qui viennent des Cell et seulement 0,4 qui viennent des Opterons.
Le Roadrunner est actuellement en phase de tests (on peut voir des photos de l'assemblage ici) et il ne serait pas surprenant qu'IBM lance un petit run de LINPACK afin d'essayer de figurer dans le Top 500 de juin en brisant le mur du pétaflops. Si ce n'est pas le cas alors il faudra attendre celui de novembre pour coiffer la couronne.

La présentation pdf de l'architecture de Roadrunner souligne en page 29 que la distribution Linux utilisée est basée sur une Fedora (avec bien entendu une compatibilité Red Hat Entreprise Linux). Cette même présentation annonce en haut à droite de la page 16 que le futur du microprocesseur Cell est d'ores et déjà défini. Cela va consister essentiellement à doubler le PPE (on aura donc 2 coeurs PowerPC gérant chacun 2 threads) et à quadrupler les SPU (32 unités vectorielles au lieu de 8) pour obtenir une puissance de calcul estimée à un téraflops en simple précision (5 fois la puissance du PowerXCell 8i).

Incidemment on peut noter que cette présentation du futur super-Cell nous dévoile aussi peut-être le coeur de la future console de jeu de Sony. En effet la si particulière architecture Cell a nécessité d'énormes investissements de la part des éditeurs de jeux. Après des débuts très difficiles et des sueurs froides devant la complexité de programmation, les moteurs de jeux arrivent maintenant doucement à maturité et on peut penser que Sony voudra préserver cet investissement. Il serait impensable que le géant japonais s'aliène les développeurs en basculant sur une architecture complètement différente et il ne faut donc pas être grand clerc pour subodorer que ce super-Cell est destiné à équiper la future Playstation 4 (sans doute dans une version simple précision). Cela permettrait de profiter facilement des acquis et du code qui ont été produits pour la Playstation 3.

Quoi qu'il en soit, le combat actuel pour la tête du Top 500 entre Ranger et Roadrunner fait rage et le suspense reste entier pour savoir qui va sortir vainqueur le mois prochain. La domination écrasante de Linux n'est donc pas prête de s'interrompre puisque maintenant pratiquement tous les constructeurs de superordinateurs utilisent l'OS libre (seules les machines purement vectorielles comme le NEC SX-9 résistent encore). Cray y est venu avec son XT-5 basé sur une distribution Suse Linux, IBM utilise également Suse Linux pour les noeuds d'entrées/sorties de son architecture BlueGene (mais pas encore pour les noeuds de calcul) et utilise Fedora Linux pour Roadrunner, SGI offre depuis longtemps Linux pour sa famille de superordinateurs Altix. Enfin Sun est obligé de manger son chapeau et de bâtir le superordinateur Ranger en utilisant Linux au lieu de Solaris, son propre système d'exploitation.

Dans le domaine du calcul scientifique l'avenir est donc rose pour l'OS libre et le rendez-vous est pris en 2019 pour le franchissement de la barrière symbolique suivante. Prochain arrêt l'exaflops !

Cette discussion est archivée, il n'est plus possible de laisser des commentaires.

Note : les commentaires appartiennent à ceux qui les ont postés. Nous n'en sommes pas responsables.

Comme d'habitude

Posté par briaeros007 () le 25/05/2008 à 16:48. (lien). Évalué à 6.

Un excellent article de patrick_g.
Il l'a promis, et il l'a fait.
Merci bien ;)
(ben voui, c'est au premier de dire ça, non ?)

--
Subete ga wakatta toki…watashi ga anta wo korosu.

PowerPC

Posté par yellowiscool (Jabber id, page perso, ) le 25/05/2008 à 19:51. (lien). Évalué à 7.

C'est quand même bien le power pc. Ou alors c'est le x86 qui n'est pas très bien, mais qui est choisis pour des raisons de coûts.

Sinon, 3.9MW c'est la production d'une grosse éolienne dans des conditions optimales. Ils n'ont plus qu'à en planter autour du data-center.

Pour être exhaustif...

Posté par Laurent Vivier (page perso, ) le 25/05/2008 à 20:02. (lien). Évalué à 6.

il faudrait citer Bull qui fournit aussi ses supercalculateurs à base de linux (notamment celui du CEA).

un truc qui fait peur

Posté par PegaseYa () le 26/05/2008 à 09:18. (lien). Évalué à 10.

je travaille dans un labo de recherche (pour situer le contexte) et nous avons quelques clusters de calcul (notamment un récent basé sur des noeuds altix de sgi, faisant tourner des Suse SLES).
cela fait quelques temps que microsoft nous harcèle (un coup de téléphone par jour en moyenne, mais rien à voir avec notre achat récent) pour essayer de nous caser leur solution. Vu que nous avons ce qu'il faut pour l'instant, microsoft se donne les moyens, c'est à dire qu'ils nous proposent de nous mettre à disposition, dans nos locaux, la machine et le système gratuitement, pour une durée illimitée. C'est pas beau ça ?

Il parait que leur OS est pourri (je dis bien il parait !), mais vu les moyens qu'ils ont, il vont finir par faire quelque chose de potable. Et ça peut faire très mal...

comme dirait l'autre, la première dose est gratuite... ;)

PS: linux a été validé sur leur machine ? :D

Bonne nouvelle

Posté par petit_bibi () le 27/05/2008 à 15:48. (lien). Évalué à 5.

Avant la fin de cette année un superordinateur dépassera la barre mythique du pétaflops

On va enfin pouvoir faire tourner Vista dans emacs en gardant sa machine en vi !

Trop gros, m'a échappé ->[]

Moore, c'est trop lent!

Posté par Temsa (Jabber id, page perso, ) le 29/05/2008 à 00:22. (lien). Évalué à 2.

Considérons la loi de Moore:
"Les processeurs doublent de puissance tous les 18 mois".

A présent, un peu de math (étant fatigué, j'espère que je fais pas d'erreur).

12 ans, c'est 12*12/18=8 * 18 mois, on est donc sensé avoir doublé 8 fois de puissance par rapport à l'Asci Red, ce qui veut dire qu'on doit avoir multiplié la puissance par 2 ^ 8 = 256.

Le facteur pour passer du téraflop au pétaflop, est de 1000, soit environs 256*2*2, ce qui nous donne 2*18 mois = 3 ans d'avance pour parvenir à ce résultat.

Si on considère les incertitudes sur la date qu'on peut majorer à 1 an sur la différence (l'un au premier janvier, l'autre le 31 décembre, j'ai pas regardé la date de sortie de l'Asci Red), ceci fait entre 2 et 4 ans d'avance, soit entre 16.67% et 33.33% d'avance par rapport à cette loi.

Les super calculateurs sont donc toujours, relativement à cette loi, de plus en plus gros par rapport à leur prédécesseur, bref la course à la puissance s'accélère!

Mais bon, si l'on fait des super calculateurs à base de carte graphique, si l'on en croit wikipedia ( http://en.wikipedia.org/wiki/FLOPS ) , on devrait exploser facilement le nombre de FLOPs, puisqu'en 2007, une carte NVidia 8800 Ultra pouvait faire 576 gigaflops tandis qu'un quadriprocesseur haut de gamme sortait 30 gigaflops. Pour autant, d'apres l'article, la carte graphique ne fait pas les memes "flops" qu'un processeur, elle est limitée à 32 bit de précision dans ce cadre.

[troll]
De toute façon, les CPU, c'est has been ( http://www.lesnumeriques.com/news_id-5127.html ). A quand un GIMP qui exploite réellement la carte graphique ?
[/troll]

Revenir en haut de page