Des infos filtrent enfin sur l'architecture de la future puce d'IBM-Sony-Toshiba qui équipera la Playsation 3 et aussi des workstations IBM.
Cette puce c'est "The Cell".
Alors que la présentation technique détaillée officielle est pour février un type (Nicholas Blachford) a pris la peine de comprendre en profondeur les brevets déposés sur The Cell et vient de publier une (longue) analyse :
http://www.blachford.info/computer/Cells/Cell0.html(...)
http://www.blachford.info/computer/Cells/Cell1.html(...)
http://www.blachford.info/computer/Cells/Cell2.html(...)
http://www.blachford.info/computer/Cells/Cell3.html(...)
http://www.blachford.info/computer/Cells/Cell4.html(...)
http://www.blachford.info/computer/Cells/Cell5.html(...)
Il semble qu'il s'agisse d'un vrai monstre de puissance !
Quelques phrases de l'article :
The first Cell based desktop computer will be the fastest desktop computer in the industry by a very large margin. Even high end multi-core x86s will not get close.
The PC has always been able to beat competition by virtue of it's huge software base, but this base is not as strong as it once was. A lot of software now runs on Linux and this is not dependant on x86 processors or Microsoft.
Cell is going to turn the industry upside down, nobody has ever produced such a leap in performance in one go and certainly not at a low price.
To date the PC has defeated everything in it's path. No competitor, no matter how good has even got close to replacing it. If the Cell is placed into desktop computers it may be another victim of the PC. However, I think for a number of reasons that the Cell is not only the biggest threat the PC has ever faced, but also one which might actually have the capacity to defeat it.
Cette puce c'est "The Cell".
Alors que la présentation technique détaillée officielle est pour février un type (Nicholas Blachford) a pris la peine de comprendre en profondeur les brevets déposés sur The Cell et vient de publier une (longue) analyse :
http://www.blachford.info/computer/Cells/Cell0.html(...)
http://www.blachford.info/computer/Cells/Cell1.html(...)
http://www.blachford.info/computer/Cells/Cell2.html(...)
http://www.blachford.info/computer/Cells/Cell3.html(...)
http://www.blachford.info/computer/Cells/Cell4.html(...)
http://www.blachford.info/computer/Cells/Cell5.html(...)
Il semble qu'il s'agisse d'un vrai monstre de puissance !
Quelques phrases de l'article :
The first Cell based desktop computer will be the fastest desktop computer in the industry by a very large margin. Even high end multi-core x86s will not get close.
The PC has always been able to beat competition by virtue of it's huge software base, but this base is not as strong as it once was. A lot of software now runs on Linux and this is not dependant on x86 processors or Microsoft.
Cell is going to turn the industry upside down, nobody has ever produced such a leap in performance in one go and certainly not at a low price.
To date the PC has defeated everything in it's path. No competitor, no matter how good has even got close to replacing it. If the Cell is placed into desktop computers it may be another victim of the PC. However, I think for a number of reasons that the Cell is not only the biggest threat the PC has ever faced, but also one which might actually have the capacity to defeat it.
> Lire le journal (51 commentaires, moyenne: 3,7).
Vous avez demandé le commentaire #525117.



???
The first Cell based desktop computer will be the fastest desktop computer in the industry by a very large margin. Even high end multi-core x86s will not get close.
Depuis quand les x86 sont réputés pour être rapides ? avec toute la compatibilité qu'ils traînent... Si il veut des trucs puissants, qu'il compare avec un alpha, un G5...
[^]Re: ???
Ben il compare avec le desktop standard....avec le truc le plus répandu.
En plus on est d'accord pour dire qu'un G5 est plus puissant mais la marge par rapport aux X86-64 est faible...très faible (à part sur les trucs vectoriels ou le G5 explose tous les X86).
Visiblement ibm et sony veulent que le Cell se répande partout (embarqué+console de jeux+desktop+calcul scientifique...etc etc)....donc les prix vont baisser et la puce sera compétitive !
[^]Re: ???
hum.. faut lire un peu l'article..
http://www.blachford.info/computer/Cells/Cell_Arch.gif(...)
A premiere vu le Cell est une architecture distribuée à base de risc. Vu qu'il y a ibm dedans, ils se pourrait que le risc en question soit un G5..
Je est un autre.
[^]Re: ???
En nombre entier "pure", les derniers x86 sont effectivement les plus rapide du monde. Loin devant tout le reste. Même alpha, même Itanium 2.
En nombre flottant, c'est les 2 autres cités qui sont les meilleurs.
En calcul "vectoriel", je n'ai pas vu de bench mais le G5 avec son altivec doit aller un peu plus vite qu'un x86 même plus rapide. Mais cela ne concerne que la 3D et la compression video.
De plus l'avance de l'altivec se réduit depuis la sortie du SSE3.
[^]Re: ???
"Loin devant tout le reste", c'est vide dit. l'avantage en perf sur les entiers d'un P4 3.6GHz, par exemple sur un Power5 1,9GHz n'est pas très important. Surtout quand on le met en regard de l'écart qu'il y a dans l'autre sens sur les calculs en flottant.
En outre le P4 est essentiellement optimisé pour un exécuter très vite des opérations simples sur des entiers, étant donné qu'il y consacre une part importante de ses unités de calcul et qu'il tourne à une fréquence élevée.
A ce niveau, on peut dire que c'est un choix, celui de pousser (ou pas) en priorité la capacité en calcul entier scalaire. ça serait probablement comparativement beaucoup plus facile pour IBM de doubler intel sur les entiers en concevant des processeurs qui ont davantage d'unités de calcul dédiés à ce type d'opération (vu qu'il y en a que deux pour l'instant) - et d'autant plus vu que le gap de fréquence à tendance à se réduire - que pour intel de porter son architecture x86 au niveau de l'itanium ou du Power5 sur les flottants.
En outre en 3D, et également en image 2D fixe, car il y a pas que les images qui bougent dans la vie, les perspectives d'utilisation des unités vectorielles commencent à être fortement limités par les GPUs qui font vraiment beaucoup aujourd'hui.
Il y a quand même des usages pour un certain nombre de traitements sonores et d'autres usages plus exotiques ; par exemple Motorola avait produit des exemples d'applications sur TCP/IP.
Bref, le vectoriel ça a un champ d'application assez large, pour ceux qui ont le temps de mettre le nez dans l'optimisation.
[^]Re: ???
Il compare en fait The Cell a du multiprocesseur x86. La plupart des gros serveurs versatiles (comprendre les superscalaires et les vectoriels ne comptent pas) sont en x86 ou en x86-64.
A l'heure actuelle même un SGI en X-bar peine à remonter et à traiter autant d'informations par processeur qu'un Xeon sur une architecture PCI-Express.
En traitement mathématique pur (ie si la remonté de données n'est pas problématiques) l'Athlon 64 est quasiment imbattable au niveau mips/$.
Si il veut des trucs puissants, qu'il compare avec un alpha, un G5...
Alpha est mort, les sparcs s'orientent beaucoup plus vers de l'embarqués que vers du haut de game et ont beaucoup de mal à monter en fréquence (probablement parceque personne n'essaye vraiment.)
En ce qui concerne le G5, il a de bonnes capacités DSP, mais en perfs pures il a du mal. A fréquence équivalente un G5 peine a égaler un Pentium 4 non xeon et pleure devant un Athlon (même non 64). Et les Pentium comme les Athlons existent dans des fréquences bien supérieures à celles de G5 pour des coups nettement moindre.
Un coup d'oeuil à spec.org suffit à s'en assurer.
Kha
root est un privilège, pas un droit !
[^]Re: ???
spec.org ? où exactement ?
[^]Re: ???
un G5 peine a égaler un Pentium 4 non xeon
T'es vraiment sûr ?
Alpha est mort
Alpha est mort je sais et je regrette beaucoup...
[^]Re: ???
Je répond aux deux messages d'un coup.
En performances pure (CPU2000 test CINT et CFP) faites uen recherche avec comme argument : processor matches 'powerpc 970'
et ensuite avec processor matches 'pentium'.
http://www.spec.org/cgi-bin/osgresults?conf=cpu2000(...)
Regardez tout ce qui dépasse 2000 Mhz.
le gros bipro JS20 d'IBM avec deux processeurs monocore à 2200Mhz a les résultats suivants :
entier : 1040/986
flotant : 1241/1178
a comparer avec un Pentium 4C à 2,40Ghz en entier (1071/1039)
et un Pentium 4E à 2,8Ghz en flotant (1328/1326)
Le JS2000 étant avantagé légèrement par le fait que ces deux cores sont complets contrairement au pseudo core hyper threading, mais les résultats sont à peu prés valables (comme tout benchmark ca pemret de se faire uen idée sur un point très précis, ici la capacité à faire tourner le spec test)
En système monocore x2 on a un léger gain de perf vis à vis d'un bicore G5 comme celui des Macs pour cause de bus doublé. Mais rien de transcendant.
Bien qu'Apple fasse partie du spec consortium, aucun bicore G5 n'est testé officiellement, d'ou la nécessité de se rabattre sur le monocore IBM.
De facon générale on peut dire qu'en perf pure un Pentium4E 5% plus rapide qu'un G5 l ebat à plate couture en entier et a à peu près les même perfs en flottant.
Kha
root est un privilège, pas un droit !
[^]Re: ???
sachant que les Pentium executent du code compilé par le compilo Intel hyper-optimisé-de-la-mort-qui-tue alors que pour les PPC c'est du GCC classique........
[^]Re: ???
IBM poste en général des benchs compilés avec ses propres compilo PPC proprio (xlc et fortran), qui optimisent fort bien.
[^]Re: ???
Et optimiser de l'ultra risc multicore est beaucoup plus facile (avec un algo d'allocation chromatique) à optimiser que du cisc x86 à la sauce intel.
Sur x86 t'as toujours 4 registres, sur g5, 32.
[^]Re: ???
le ppc970 n'est pas un bi-core, et les G5 d'apple sont des machines bi-processeurs parfaitement classiques (tout comme les bi-opterons et les bi-xeons qui sont vendus sur le même segment d'ailleurs).
Les bi-cores chez IBM sont les Power4 et Power5 qui sont utilisés dans leur gammes de serveurs chers (mais puissants).
Le bi-core sur le segment des processeurs desktop et petits serveurs, c'est pas encore en magasin.
[^]Re: ???
« De facon générale on peut dire qu'en perf pure un Pentium4E 5% plus rapide qu'un G5 l ebat à plate couture en entier et a à peu près les même perfs en flottant. »
Euh, désolé, mais je n'en ai franchement pas l'impression, et pourtant je me base sur exactement les même benchmarks que toi.
En entier :
- le PPC (1 seul!) à 2.2 GHz fait du 1040 (soit 1134 à 2.4)
- le Pentium4C avec HT à 2.4 GHz fait du 1071
En flottant :
- le PPC x 2 à 2.2 GHz fait du 1241 (soit 1579 à 2.8)
- le Pentium 4E avec HT à 2.8 GHz fait du 1328
Même en considérant l'HT comme équivalant à un monocore, le PPC bat le Pentium en entier, et il le bat encore en flottant si on considère cette fois ci l'HT comme du biproc... (bon ok pour le coup des flottants c'est plus difficile de se prononcer... forcement c'est un peu comme comparer de la choucroute avec du whisky).
Et d'ailleurs si on va chercher ailleurs sur le net, et bien on peut constater que... ben que rien du tout vu que tout le monde sort des benchmarks dans tout les sens pour promouvoir les machines qu'ils veulent vendre ou se rassurer de celle qu'ils viennent d'acheter...
Bref on est pas d'avoir un avis objectif sur la question, alors les affirmations « à plate couture »... sortons les benchmarks d'Apple pendant qu'on y est :^)
[^]Re: ???
l'avantage des benchs Apple c'est que tout est compilé avec GCC....c'est le bon sens non ?
Alors que les scores SPEC ne reflètent rien d'autre que le couple compilo/CPU.
PS : sinon les benchs apple sont quand mêmes biens partiaux on est d'accord.
[^]Re: ???
l'avantage des benchs Apple c'est que tout est compilé avec GCC....c'est le bon sens non ?
Non, GCC ne supporte pas toutes les optimisations de tous les processeurs; ils favorise donc certains processeurs par rapport à d'autres.
Je pense que le couple meilleur compilateur du vendeur/puce du fabriquant est un bien meilleur indicateur en performance pure.
Kha
Kha
root est un privilège, pas un droit !
[^]Re: ???
Pour nous autres utilisateurs de système GNU, le seul test valable c'est les trucs compilés avec GCC puisque quasiment tout ce que nous utilisont est compilé avec GCC.
Rien à foutre que le processeur shmurtz soit le meilleur processeur du monde quand on utilise le compilateur shmurtz, si au final le processeur est une vraie bouze chez moi sous pretexte que je n'utilise pas un compilateur proprio...
[^]Re: ???
C'est le problème des benchs : il faut définir clairement au départ ce qu'on est censé tester.
Bon pour en revenir au sujet, on peut espérer que le SDK standard de la PS3 sera livré avec autre chose que GCC.
[^]Re: ???
Je préférerais plutôt que sony investisse et contribue à gcc...
[^]Re: ???
Pardon, je n'avais pas vu que le second pro avait été désactivé pour les tests en entier. Par contre les performances ne sont pas forcément croissantes linéairement.
Bon en ce qui concerne le rapport bi-core/HT il est clair que l'on peut difficilement parler de match équitable, ne seait-ce que pour des raisons de bus et de complétude du second core.
Ceci étant il est vrai aussi que les archis privilégiées par IBM pour le calcul lourd sont surtout les POWER (4,4+,5). Donc on peut penser qu'éventuellement le JS20 n'a pas des bus aussi performants que ce qu'IBM peut faire, ceci étant la carte mère Intel est une carte workstation etc.
Le Pentium 4E est légèrement plus puissant en calculs purs que le 4C, ceci est valable aussi pour les entiers (5% de boost de performance à peu près).
Par exemple en entier :
2.80C 1204 1166
2.80E 1269 1219
En ce qui concerne ma remarque c'était juste pour donner un équivalent, elle n'aurait pas été là si j'avais mieux lu le spec et que j'avasi vu le second CPU désactivé sur les tests en entier.
Kha
root est un privilège, pas un droit !
[^]Re: ???
On va pas le repeter 50 fois, c'est débile de comparer des procs à vitesse équivalente !!!
Chacun à fait son choix d'archi.
L'un optimise son IPC, l'autre décide de permettre une montée en fréq façile.
On peut disserter de ce qui parait le mieux théoriquement mais pas dans un test pratique.
Il faut comparer par gamme de prix ou par cible.
C'est comme faire des tests de reprise en 5ieme à 2000 tr/min entre un TD et une essence classique... mais c'est supair ?!
[^]Re: ???
Lis mieux. Les résultats entiers du 970, c'est marqué " 1 core, 1 chip, 1 core/chip" à droite...
Claws Mail - it bites!
[^]Re: ???
Je suis assez d'accord avec toi. Sparc est controllé par SUN qui n'a plus trop les moyen de suivre. A prioris, il se sont jetter sur une nouvelle archi : multi-core et smt à fond. Avec des processeurs simples, non out-of-order (qui ont une taille exponentiel avec le nombre d'unité de calcul à utiliser) et sans doute assez pipeliné pour gagner en perf et le smt mangera les cycles inoccupé. Je pense aussi qu'il viseront une consomation raisonnable.
On parle de 4 core 4x smt sois 16 proceurs logiques sur une puce.
Dans la vie destok, aucun outil ne sait tirer parti de 16 processeurs (pas encore tout du moins). Par contre, tout ce qui est serveur l'utilise très bien.
En fait, le cell c'est un "G6" avec 8 DSP SIMD sous control.
Quelques part, cela ressemble au architecture next qui était composé d'un 68xxx et d'un DSP vu comme une ressource par l'OS.