Journal : Sun Rock : Les détails arrivent

Posté par patrick_g (page perso, ) le 05 février 2008
0
La conférence ISSCC qui a débuté le 3 février est l'occasion d'avoir enfin des détails sur tous les futurs processeurs qui vont sortir prochainement.
Le site ArsTechnica propose une première analyse du nouveau processeur Sparc de SUN : le Rock.
On sait que Sun a choisi une voie originale avec ses processeurs Niagara 1 et 2. Plutôt que de lutter sur la puissance brute d'un seul coeur d'exécution, les Niagara privilégient la puissance cumulée de plusieurs coeurs (8) et ils masquent la latence mémoire en ayant plusieurs threads par coeur (8). Au final, pour le Niagara 2,on obtient un CPU de 8 coeurs ayant chacun 8 threads ce qui donne 64 threads pour un processeur dissipant à peine 72 watts à 1.4 GHz.
Cette architecture audacieuse a été bien accueillie et Sun se félicite de son choix technique original.
L'ennui c'est que si Niagara est très efficace sur des programmes spécifiques (comme les serveurs web) sa puissance reste faible pour des programmes classiques nécessitant une puissance par coeur plus importante.
La solution de Sun se nomme Rock et il n'est pas moins original que son petit frère Niagara.

Le Rock possède 16 coeurs ayant chacun 2 threads et il tourne à 2.3 GHz. Pour augmenter la puissance par coeur la technique habituelle est d'opter pour l'exécution des instructions dans le désordre (Out-of-order) et Sun aurait pu se contenter de ça : prendre un Niagara (in order) et lui ajouter le out-of-order. L'ennui c'est que le OOO est très compliqué : il faut consacrer beaucoup de transistors au suivi des instructions puisqu'elle peuvent se balader dans tous les sens. En plus comme la fréquence des CPU est très supérieure à celle de la RAM il faut consacrer aussi beaucoup de transistors au masquage des latences. Sun a donc décidé d'utiliser une nouvelle technique : le scout thread.
Ce thread "de reconnaissance" est l'un des deux threads qui s'exécutent dans chaque coeur et, quand le premier thread est bloqué par un accès mémoire lent, il continue a exécuter les flot d'instruction du programme !
Le premier thread est sauvegardé dans un checkpoint (un registre fantôme) et le thread de reconnaissance (totalement transparent pour le programme ou pour l'OS) continue son travail et sauve les résultats dans une mémoire très rapide (SRAM).
Quand le premier thread a enfin reçu les informations venant de la RAM lente il peut rattraper son retard en se servant directement des résultats sauvés dans la SRAM au lieu de devoir exécuter les instructions du programme.
Si le scout thread est bloqué lui aussi par un accès mémoire alors le thread principal lui "saute par dessus" et devient le scout thread a sa place !
L'article d'ArsTechnica explique très bien toute cette machinerie.

Cette architecture originale à l'avantage de ne nécessiter aucun travail d'adaptation des programmes et devrait permettre à Sun d'augmenter considérablement la puissance par coeur de ses CPU.
Le désavantage c'est que tous les registres fantômes utilisés dans les checkpoints et tous ces scouts threads qui s'exécutent en permanence grèvent le budget énergétique. Un Rock cadencé à 2.3 GHz et gravé en 65 nm dissipe 250 Watts !!!

Il est à noter également que Sun n'a évidemment pas tout dévoilé de son nouveau bébé. On parle beaucoup d'un support hardware de la notion de mémoire transactionnelle. C'est un nouveau modèle qui permettrait d'exécuter des tâches en parallèle sans avoir à gérer toutes la complexité des verrous et les risques de bugs d'interblocage.

Comme l'affirme David Yen, le boss des CPU chez Sun, il n'est pas possible de lutter contre Intel sur le plan de la finesse de gravure car ils sont les plus fort. il faut donc innover coté architecture. Rock va donc avoir des "fonctionnalités qui jusqu'à présent n'existaient que dans des publications académiques" et on peut s'attendre a d'autres révélations très bientôt.

> Lire le journal (30 commentaires, moyenne: 4,2).  

Vous avez demandé le commentaire #901663.

prévoir climatiseur...

Posté par aedrin () le 05/02/2008 à 18:25. (lien). Évalué à 3.

Un Rock cadencé à 2.3 GHz et gravé en 65 nm dissipe 250 Watts !!!

à quoi rime cette course à l'armement sur la fréquence CPU ?
après c'est pas étonnant de se retrouver avec des alims de 1000w et 6 ventilateurs par tours...

moi qui pensait (ou espérait ;-( ) que le ratio fréquence/tdp allait devenir à la mode ces temps-ci...

le jour où ça commencera à rentrer dans les moeurs, les architectures prendront compte de la consommation au moment de leur conception

  • [^]Re: prévoir climatiseur...

    Posté par patrick_g (page perso, ) le 05/02/2008 à 19:04. (lien). Évalué à 4.

    D'après les gars de Sun le ratio perfs/conso est bon car, même si la conso est forte, les perfs sont très bonnes.

    "We decided what mattered was power efficiency more than overall power"

    [^]Re: prévoir climatiseur...

    Posté par CrEv (page perso, ) le 05/02/2008 à 19:17. (lien). Évalué à 4.

    en même temps, un sparc à 16 coeurs tous hyper threadés, ça semble pas trop fait pour des tours...
    La course à la fréquence ok, mais ça n'explique pas uniquement la puissance dissipée je pense...

    [^]Re: prévoir climatiseur...

    Posté par Nicolas Boulay () le 05/02/2008 à 20:05. (lien). Évalué à 6.

    Cela ne fait que 32W par coeur, cela n'est pas énorme.

    [^]Re: prévoir climatiseur...

    Posté par Troy McClure (page perso, ) le 05/02/2008 à 22:06. (lien). Évalué à 4.

    y'a quand même intel qui s'est décidé à sortir un cpu x86 à très basse consommation (moins d'un watt annoncent-ils) compatible avec le jeu d'instruction des Core 2

    http://www.anandtech.com/cpuchipsets/intel/showdoc.aspx?i=31(...)

    Si le prix est honnete y'aura surement moyen d'en faire des choses assez sympa !

    [^]Re: prévoir climatiseur...

    Posté par Matthieu Lagouge (Jabber id, page perso, ) le 06/02/2008 à 05:29. (lien). Évalué à 3.

    Certes, je ne pense pas qu'il aura beaucoup de succès dans les ordis portables et l'embarqué... mais est-ce le but?
    S'il abat plus de boulot que 10 procs à 32W, alors on en sort gagnant tout de même!

    • [^]Re: prévoir climatiseur...

      Posté par Nicolas Boulay () le 06/02/2008 à 09:37. (lien). Évalué à 2.

      Il faut voir pour cela la bande passante mémoire qu'il dispose. Il a intérêt à avoir plusieurs Go de bande passante et/ou une sacré mémoire cache.