alimentation boîtier carte 3D carte mère configuration disque dur ecran intel netbook nvidia
Que vaut Stars, l'architecture du Phenom ? |
|
|
| Écrit par Pascal Thevenier |
| Mercredi, 26 Décembre 2007 20:18 |
En avril 2005, Intel a été le premier à proposer un processeur Dual Core grand public avec le Pentium 840 Extreme Edition. Ce processeur « Smithfield » se compose tout simplement de deux dies « Prescott 1 Mo » en 90 nm installés côte à côte… Cette solution a renforcé les points forts du Pentium 4, notamment les performances multimédia mais elle surtout fait ressortir son très mauvais côté, à savoir une consommation et une dissipation déraisonnables. Arrivés un mois plus tard, les Athlon 64 X2 ont d’emblée fait l’unanimité. Pas question de bricolage de dernière minute, l’Athlon 64 X2 est un vrai processeur Dual Core natif dont les deux cœurs d’exécution communiquent ensemble directement et partagent des ressources afin d’augmenter les performances. Intel a repris sa recette des deux dies pour commercialiser ses premiers processeurs Quad Core avant son concurrent. Un an plus tard, AMD revient avec le Phenom, le premier Quad Core natif…
Petit historique…Quand AMD a lancé ses premiers Athlon 64 en support 754, le fondeur disposait d’une base saine : l’Athlon XP dérivé des premiers Athlon qui menaient la vie dure aux Pentium !!!. Pour faire court mais sans être péjoratif, l’Athlon 64 est un Athlon XP optimisé avec des registres 64 bits et dans lequel un contrôleur mémoire a été intégré. Cette intégration permet au Athlon 64 de tirer parti des meilleurs modules de DDR400 fonctionnant en CL2 et ainsi d’obtenir à fréquence égale des performances plus élevées que l’Athlon XP. Par la suite, l’Athlon 64 a gagné un contrôleur double canal pour suivre la tendance « Dual Channel ». Même si les gains sont relativement faibles, l’Athlon 64 socket 939 n’a fait que bonifier l’architecture K8. L’apogée arrive en mai 2005 avec l’Athlon 64 X2, le premier processeur Dual Core natif. Les cœurs d’exécution qui communiquent directement ensemble via le « Crossbar Switch » et partagent certaines ressources comme le contrôleur mémoire et le lien Hypertransport. Les Athlon 64 X2 sont performants, consomment et chauffent peu et pour ne rien gâcher, ils fonctionnent sur les cartes mères Socket 939. Si les Athlon et les Pentium !!! rivalisaient réellement sur le plan des performances, le Pentium 4 a déçu. En effet, alors que les descendants des Athlon sont toujours arrivés sur le marché avec un gain de performances sur la génération précédente, les premiers Pentium 4 étaient plus lents que les derniers Pentium !!! et donc que les Athlon et Athlon XP. Ce n’est vraiment qu’avec le Pentium 4 « C » qu’Intel revient dans la course et donne un avant goût du confort des systèmes biprocesseurs grâce à la technologie HyperThreading. Alors qu’AMD bonifiait ses Athlon puis Athlon 64, Intel s’est enlisé dans une vaine montée en fréquence. Elle s’est soldée par une consommation incontrôlée et des performances en recul avec les Prescott (rebaptisés « Presque Hot ») et autres Presler… Paradoxalement, dans le monde mobile, Intel a bien vite compris que le Pentium 4 était une voie sans issue. Le fondeur a fait table rase « du passé proche » pour concevoir le Pentium-m. Il reprend une partie du Pentium !!! ainsi que les améliorations issues de Netburt. Le résultat est un cocktail détonnant que les utilisateurs de portables savourent depuis 2003… Les portables ont même eu droit au premier vrai processeur Dual Core d’Intel début 2006 avec les Centrino Duo alors que les Pentium D – les faux Dual Core à base de Prescott – étaient toujours de mise dans les ordinateurs de bureau… Tout bascule durant l’été 2006. Intel laisse enfin tomber les Pentium 4 et D au profit des Core 2 Duo. Ces derniers n’ont que des points forts : performances exceptionnelles, faible consommation, prix raisonnables et overclocking de très haut niveau. Un véritable raz de marée…Au cours de l’ère Pentium 4, Intel a quand même réussi à « imposer » de nouvelles technologies notamment durant l’été 2004 avec le PCI-Express et la DDR2. Si la première a été très bénéfique pour AMD avec un succès énorme pour les configurations nForce4 en Socket 939, la seconde est à la source d’un premier coup de couteau dans le dos des Athlon 64 et Athlon 64 X2. En effet, la DDR2 n’est pas aussi bien adaptée au contrôleur mémoire intégré des Athlon 64 en raison d’une latence plus élevée (voir l’article Athlon 64 AM2). Pour la première fois, les performances de l’Athlon 64 ont reculé. Les Athlon 64 X2 AM2 n’ont d’ailleurs pas connu le succès de leurs aînés d’autant plus que tout le monde avait déjà les yeux tournés vers les Core 2 Duo… Le Phenom va-t-il renverser la vapeur ? L’architecture du Phenom En regardant les diagrammes simplifiés de l’agencement interne d’un Athlon 64 X2 et d’un Phenom, les similitudes sont évidentes. Nous sommes bien en présence d’un processeur « quad cores » natif. Les quatre cœurs d’exécution du Phenom disposent de 512 Ko de cache L2 chacun et partagent un cache L3 inédit de 2 Mo. La communication interne est ensuite prise en charge par le « Crossbar Switch » et le « System Request Interface» comme sur les Athlon 64 X2. Enfin, le double contrôleur mémoire et le contrôleur Hypertransport 3 assurent les entrées et sorties.
L’architecture d’AMD anciennement connue sous le nom de K10 a été renommée Stars. Et à l’image de son concurrent, AMD a amélioré son nouveau processeur à tous les niveaux.
Les cachesIntel bénéficie d’une certaine avance au niveau de la technologie de gravure. Le fondeur a donc passé le cache L2 de ses processeurs à 6 Mo unifiés par Core. AMD se limite à 512 Ko de cache par core d’exécution mais compense avec un cache commun L3 de 2 Mo. Au niveau du cache L1, le Phenom embarque 64 Ko pour les données et de 64 Ko pour les instructions pour chaque core. Les trois niveaux de cache du Phenom sont de type exclusif. En d’autres mots, ce qui est dans un niveau de cache n’est jamais dupliqué. Cette approche permet de maximiser la mémoire cache disponible. En contrepartie, il faut très souvent faire migrer les données d’un cache à l’autre. Cependant, pour optimiser les applications multithreads, le cache L3 peut conserver des données et/ou instructions souvent utilisées. Nous avons utilisé RightMark Memory Analyser pour étudier le comportement du cache du Phenom afin de le comparer à celui de l'Athlon 64 et du Core 2 Quad en 45 nm. L'analyse port sur la latence du cache et le taux de transfert de la mémoire. En comparant les caches, on constate que l’emploi d’un cache L3 n’est pas une solution intéressante face à un gros cache L2. En effet, alors que le processeur Intel en 45 nm a accès à 6 Mo de données en moins de 10 cycles, le Phenom n’a accès qu’à 576 Ko (en non 512 Ko en raison du mode exclusif) aussi rapidement. De 576 Ko à 2624 Ko, les données sont accessibles en 20 cycles. Au-delà, il faut plus de 40 cycles au Phenom contre moins de 30 au Yorkfield. ![]() Le plus haut sur la plus grande plage est idéal : Athlon 64, Phenom, Core 2 Quad. ATTENTION à l'échelle du Core 2 Quad deux fois plus basse ! Au niveau de la bande passante pure, les Athlon 64 et Phenom sont exceptionnels lors de la lecture des caches L1 et L2. En écriture, les performances sont comparables à celles de leur concurrent. Une fois encore, le Yorfield conserve l’avantage en raison de son plus gros cache L2. Hors des caches (après 6 Mo pour le Yorkfield et 2,6 Mo pour le Phenom), la mémoire elle-même lisse les performances… Le contrôleur mémoire Depuis l’Athlon 64, le contrôleur mémoire est intégré au processeur (et donc plus dans le Northbridge). Le Phenom en 65 nm embarque toujours un contrôleur DDR2 mais il inaugure deux modes de fonctionnement : ganged et unganged. En mode ganged, le contrôleur 128 bits travaille de manière totalement conventionnelle comme dans l’Athlon 64. Lors du fonctionnement ungaged, il fonctionne comme deux contrôleurs 64 bits distincts. Ce dernier mode est mieux adapté aux opérations multithreads les car les deux contrôleurs peuvent agir de manière indépendante (asymétrique) et plus de manière identique (symétrique). L’un peut lire pendant que l’autre écrit, ce qui est impossible avec un contrôleur 128 bits classique. ![]() Contrairement à l’Athlon 64 X2 AM2 qui est incapable de fournir toutes les fréquences standardisées au niveau du bus mémoire (en raison de l’absence de certains ratios), le Phenom supporte correctement et sans perte de bande passante les DDR2-400, DDR2-533, DDR2-667, DDR2-800 et même DDR2-1066. Dans les Phenom 9500 et 9600, le contrôleur mémoire travaille à 1800 MHz. A l’avenir, AMD prévoit de porter la cadence à 2000 MHz pour les Phenom plus rapides. Cool and Quiet 2 Le Phenom introduit une nouvelle version de la technologie Cool and Quiet inaugurée par les Athlon 64. Chacun des cores du nouveau processeur peut faire varier sa fréquence et donc sa tension selon sa charge de travail. Quand toutes les unités d’exécution du Phenom sont au repos, le processeur peut entrer dans le mode C1E dans lequel les liaisons HyperTransport sont arrêtées et la mémoire mise en mode veille. Grâce au « split-plane », le contrôleur intégré et les cores sont alimentés de manière indépendante, ce qui permet une gestion très fine de l’énergie. A noter que le concurrent d’AMD n’est pas en reste au niveau de la gestion de l’énergie et que depuis le Pentium-m, les processeurs Intel peuvent également couper une partie du bus de communication avec le chipset. Enfin, comme les Core 2 Duo, les Phenom ont de nombreuses diodes de mesure de la température afin de veiller au bon fonctionnement du processeur. La « Coolcore Technology » est également en mesure de modifier rapidement et finement les fréquences et les tensions afin d’éviter d’éventuelles surchauffes de certaines zones.Un gros morceau ! Le Phenom utilise le support AM2+ mais reste compatible avec le support AM2. Sur le plus ancien connecteur, il perd cependant certaines fonctionnalités comme le « slip-plane » et le contrôleur mémoire reçoit la même tension d’alimentation que le reste du processeur. Ce dernier perd 200 MHz dans l’opération et fonctionne à 1600 MHz au lieu de 1800 MHz. Extérieurement, le Phenom et l’Athlon 64 X2 sont identiques. Avec 4 cores d’exécution dotés chacun de 128 Ko de cache L1 et de 512 Ko de cache L2 et un grand cache L3 commun de 2 Mo, le Phenom compte 463 millions de transistors qui occupent pas moins de 285mm² ! Etant un Quad Core natif, le die est naturellement d’une seule pièce et au moindre défaut, le Phenom X4 part « au rebut » ou plus précisément devient un (futur) Phenom X3 ou X2… De son côté, Intel qui « colle » deux dies de Core 2 Duo de 143mm² (65nm) ou 107mm² (45nm) pour obtenir un Quad Core ne court pas le risque de perdre un die si complexe.![]() L’araignée se casse une patte ! La partie théorique étant (enfin) bouclée, il reste à passer à la pratique ! Curieusement, après nous avoir demandé si nous avions tout le nécessaire pour tester un Phenom, AMD nous a fait parvenir une machine complète alors qu’une carte mère et un processeur auraient suffi. Pourquoi donc nous demander notre avis avant ? Certainement pour tester la nouvelle plateforme Spider qui se compose d’un AMD Phenom, d’un chipset AMD Série 7 et d’une AMD Radeon HD 3800... Malheureusement, notre araignée s’est cassée au moins une patte lors du transport ! En effet, le disque dur se baladait dans la tour… En outre, la plateforme Spider était installée dans une tour NZXT de bien piètre qualité et le montage lui-même laissait franchement à désirer ! On peut par exemple signaler le ventilateur « butterfly » qui envoyait l’air chaud vers le bas avec un flux inversé par rapport à celui induit par l’alimentation, des câbles baladeurs, des ventilateurs bruyants, etc. Par rapport à nos machines, le NZXT est déjà une calamité sonore à lui seul… De curieux choix pour un système de démonstration « Cool and Quiet 2 » qui se veut Quiet (silencieux) ! Il ne s’agit cependant que du début de nos soucis. La carte mère GA-MA790FX-DQ6 n’a jamais fonctionné autrement qu’en mode unganged. En outre, le Spider ne démarrait qu’avec des modules dans les banques 0 et/ou 2… Après avoir perdu une journée à tester différents kits de mémoire et toutes les versions du BIOS proposées par le site de Gigabyte, nous avons conclu à un autre dommage lié au transport. HiTech PC (et ShS Computer un Athlon 64 X2 4400+) nous a heureusement prêté une Asus M3A32-MVP et tout est enfin rentré dans l’ordre. Cette carte mère est d’ailleurs nettement plus évoluée que le modèle Gigagyte avec un BIOS non seulement plus complet mais également beaucoup plus explicite au niveau des options…A noter toutefois que dans un cas comme dans l’autre, l’explication des paramètres du BIOS est très laconique.Asus M3A32-MVP La plateforme Spider est un trio dont nous connaissons déjà la partie graphique depuis le test des Radeon HD 3800. Nous avons déjà longuement analysé le Phenom, il reste à toucher quelques mots sur le chipset AMD 790 FX couplé au SB600. Grâce au nortbridge 790FX, la M3A32-MVP est équipée de 4 port PCI-Express 2.0 pour le CrossFireX™. Ils fonctionnent en 16x + 16x (2 cartes), 16x + 8x + 8x (3 cartes) ou 8x + 8x + 8x + 8x (4 cartes). A ce sujet, on peut regretter qu’AMD se soit contenté de ne fournir qu’une seule carte graphique Radeon HD 3870 pour évaluer sa plateforme… Le SB600 gère quant à lui 4 ports SATA 3Gb/s (sans RAID 5), un connecteur ATA133, 10 prises USB 2.0 et l’High Definition Audio. Configuration de test Nous n’avons finalement utilisé que le Phenom 9600 et la Radeon HD 3870 envoyés par AMD, tous les autres composants étant issus de notre labo. L’installation de la machine de test n’a posé aucun problème. Au niveau logiciel, l’Overdrive d’AMD est un utilitaire vraiment sympathique. Il permet de gérer tous les paramètres du Phenom dont de très nombreux à la volée. L’Overdrive autorise par exemple le réglage manuel de la fréquence de n’importe quel core. Véritable boîte à outils, le logiciel d’AMD fait également office de programme de monitoring et d’utilitaire d’overclocking. Il est cependant limité dans cette tâche où la montée en fréquence est réduite et la modification via le BIOS reste incontournable. Quoi qu’il en soit, l’Overdrive est une réelle valeur ajoutée à la plateforme Spider. Matériel Logiciel Performances ![]() Notre première séance de mesures a pour but d’examiner les éventuels écarts de performances entre les modes ganged et unganged. Les résultats nous laissent perplexes : aucun mode ne semble clairement avantageux… Des écarts apparaissent probablement de manière significative dans le cadre d’une utilisation en tant que serveur. Il ne faut en effet pas perdre de vue que le Phenom et l’Opteron partagent la même architecture. Accessoirement et à notre grande surprise, le Phenom est à peine pénalisé par le fonctionnement en simple canal ! Il faut souligner que lors de notre comparatif des modules de DDR2-800, nous avions déjà constaté des écarts anecdotiques dans le cas d’un Core 2 Duo en single et dual channel… ![]() Nous ne tournerons pas autour du pot, si les performances du Phenom sont plus élevées à fréquence égale que celle de l’Athlon 64 X2, le dernier des processeurs AMD ne parvient pas à rivaliser avec un Penryn à 2,33 GHz. Ce dernier a certes un avantage de 30 MHz mais ils n’expliquent pas l’énorme avance du processeur Intel sur son concurrent. En outre, avec seulement 100 MHz de plus que le Phenom 9500 soit ~5%, le Phenom 9600 est à peine plus performant que son petit frère. L’écart est d’ailleurs tellement faible que sur les tests où la variance est élevée, il n’est pas rare que le meilleur score obtenu par le Phenom 9500 dépasse le moins bon atteint par le Phenom 9600. C’est notamment le cas des résultats de Crysis (dont nous présentons une moyenne de 5 mesures)… ![]() Par rapport à l’Athlon 64 X2 4400+, le Phenom 9600 qui fonctionne à la même fréquence est jusqu’à 30% plus performant dans les applications mono thread (World In Conflict). On constate aussi un très gros gain lors de l’usage intensif des instructions SSE2 (score « mono » CPU de 3D Mark 2006). L’indice CPU Mark augmente quant à lui de 15% et le temps de calcul de Pi baisse de 10%. Lors du test mono thread des Cinebench, le Phenom stagne par rapport à son aîné. En comparaison avec le Core 2 Quad à 2,33 Ghz, le Phenom ne marque des points qu’au niveau du « speed up » de Cinebench R10. En effet, en passant d’un rendu d’un à quatre cores, les performances des Phenom sont multipliées par 3,8 alors qu’elles ne le sont que par 3,5 pour le Core 2 Quad. Une bien maigre consolation étant donné que le processeur Intel est largement plus performant dans ce test comme dans tous les autres soit dit en passant… ![]() En fait, AMD a beau se moquer de son concurrent a propos de ses Quad Core non natifs, Intel dispose d’une architecture terriblement efficace qui synthétise toutes les connaissances acquises avec les différentes générations de Pentium en y ajoutant de nombreuses optimisations… La partie théorique de l’article a montré que dans bien des domaines, AMD n’a fait que d’ajouter des optimisations qu’Intel utilise déjà dans les Core 2 Duo et Core 2 Quad voire même dans les anciens Pentium 4. IPC, branch prediction, retired Instruction et cache hit (ajout du 27/12) Les tests ont montré que l’architecture Core est plus efficace que Stars. En lisant les documents d’AMD, en examinant la documentation et en étudiant d’autres articles techniques sur le Phenom, je me suis personnellement interrogé sur les causes des différences de performances. J’avais la conviction que les optimisations étaient moindres dans Stars mais une conviction n’est pas une preuve… Comment mettre en évidence les améliorations internes apportées par AMD en passant du K8 au K10 et comment les comparer à celles des processeurs Intel ? La réponse s’appelle PerfMonitor, un petit utilitaire conçu par le génial programmeur Franck Delattre auteur notamment de CPU-Z. Ce logiciel permet d’étudier les instructions traitées par cycle et par seconde, l’efficacité de la prédiction de branchement, les « retired instructions » (instructions réellement sorties du pipeline) et le cache hit rate (le taux de réussite des caches). Les logs de PerfMonitor se lancement manuellement via la touche F5, ce qui augmente un peu la marge d’erreur. En outre, étant donné qu’il date de 2006, toutes les fonctionnalités ne sont pas accessibles (en même temps) sur tous les processeurs. Cependant, PerfMonitor m’a permis de vérifier plusieurs choses importantes. Avec en moyenne 1,13 IPC, 96% de prédictions de branchement correctes et 26 M instructions retirées par seconde, l’architecture Stars du Phenom 9600 améliore les performances intrinsèques de l’architecture K8 Athlon 64 X2 4400+ AM2 (respectivement 1,05 IPC, 94,5% branch prediction true et 2400 Mir/s). Particulièrement efficace, l’architecture Core atteint 1,31 IPC, 99% de branchements corrects et 28,5 Mir/s. Ces moyennes confirment que le cœur d’exécutions des Core 2 Duo et Core 2 Quad est de 10 à 15% plus performant. PerfMonitor ne permet malheureusement pas d’étudier le comportement des instructions SSE sur le processeur Intel… Consommation, bruit, chaleur et overclocking… Côté consommation, nous attendions quand même mieux. Avec 4 instances de Prime95, la plateforme Spider avec un Phenom 9600 consomme 33% de plus que le Penryn à 2,33 GHz monté sur une Asus P5K Pro avec un Radeon HD 3870. Au repos, la situation tourne encore plus à l’avantage du processeur Intel avec un écart de 44%. Il n’y a qu’avec Prime95 et le 3D Mark 2006 de concert que l’écart tombe à moins de 18%. ![]() La machine envoyée par AMD est très bruyante, un comble pour montrer l’avantage du Cool and Quiet 2 ! Equipé d’un Noctua NH-U12P, le Phenom est silencieux… Mais qu’en sera-t-il avec le radiateur livré avec le modèle box ? Curieusement, le logiciel Overdrive n’a pas été en mesure de lire les températures des cores du Phenom sur l’Asus M3A32-MVP. Asus PC ProbeII et Everest ne rapportaient qu’une seule valeur, probablement celle de la sonde de la carte mère, mais cette dernière variait à peine… Pourtant, le BIOS accélérait la vitesse du ventilateur lors des mises en charge, ce qui témoigne d’une montée en température. L’overclocking du Phenom se fait via le « HT Link » repris en tant que FSB dans le BIOS. Avec sa tension d’origine, le Phenom supporte un bus de 233 MHz au lieu de 200 Mhz par défaut. La fréquence finale atteint ainsi 2679 MHz soit un gain de 22%. Etant donné qu’il s’agit d’un processeur en première révision, le résultat est tout à fait correct. Cependant, ce gain est bien maigre à côté de celui obtenu sur les Core 2 Duo et Core 2 Quad… A noter que notre processeur démarrait encore avec un bus à 240 MHz (2760 MHz) mais que des erreurs se produisaient souvent sous Windows. Augmenter la tension s’est soldé par une impossibilité de démarrer et non par la stabilisation du système. Conclusion Quand nous avons commencé la rédaction de la partie théorique, nous avons dans un premier temps été enthousiasmés par l’approche retenue par AMD pour réaliser le premier processeur quad core natif. L’architecture du Phenom est aussi « propre » que celle des Athlon 64 X2 et l’emploi de trois niveaux de cache est une solution élégante. Cependant, en passant en revue les différentes optimisations qui, selon AMD font du Phenom un processeur de dixième génération et non de neuvième, tout a un air de déjà vu. En effet, de nombreuses améliorations introduites avec le Phenom existent déjà dans les Core Duo et leur évolution Core 2 Duo. En outre, elles ne sont ou du moins ne semblent pas aussi bien implémentées que dans les processeurs Intel. Et c’est bien là que le bât blesse. Le Phenom utilise certaines améliorations pour la première fois alors qu’Intel les a déjà employées avec les Core Duo pour les améliorer encore avec les Core 2 Duo. Si elles permettent au Phenom d’être plus efficace que l’Athlon 64, elles ne suffisent pas face à la concurrence. Les Core 2 Duo restent donc de très redoutables adversaires invaincus ! En outre, le bug du TLB même si nous ne l’avons pas rencontré ne joue pas en faveur des actuels Phenom. Malheureusement, le bilan est également peu brillant au niveau du rapport prix/performances. Si les Phenom 9500 et 9600 devraient normalement se négocier à présent aux alentours de 200 € et 240 €, le surcoût pour le modèle 9600 est totalement injustifié compte tenu de l’augmentation marginale des performances. Il reste cependant à savoir quand Intel proposera ses Quad Core Penryn et à quels prix. Quoi qu’il en soit, étant donné que le Q6600 vaut aujourd’hui moins de 250 €, on peut au grand dam d’AMD supposer, qu’un futur Penryn 2,33 GHz sera encore moins cher tout en étant toujours plus performant…Si les Radeon HD 3800 (testées dernièrement) de la plateforme Spider nous ont laissé une bonne impression, le chipset de cette même plateforme est un peu déséquilibré. Le récent 790FX est appairé à un SB600 qui sent la naphtaline… Etant donné l’intérêt grandissant des utilisateurs envers les Radeon HD 3800, on peut logiquement penser que ceux qui préfèrent une Radeon à une GeForce et veulent un Phenom n’iront certainement pas acheter une carte mère à base de nForce et seront donc des clients « Spider ». Certes, il faut vouloir un Phenom plutôt qu’un Core 2 Duo mais pourquoi pas... AMD Phenom : 6,5/10 Pour : compatible avec le support AM2, logiciel Overdrive, fréquences indépendantes des cores, quad core natif… Contre : … mais sans intérêt pratique, performances moyennes dans l’absolu et faibles par rapport à la concurrence, Phenom 9600 à peine plus puissant que le 9500 mais beaucoup plus cher, bug du TLB |