Home Tests Dossiers Que vaut Stars, l'architecture du Phenom ?

Que vaut Stars, l'architecture du Phenom ?

Imprimer Envoyer
Note des utilisateurs: / 1
MauvaisTrès bien 
Écrit par Pascal Thevenier   
Mercredi, 26 Décembre 2007 20:18
En avril 2005, Intel a été le premier à proposer un processeur Dual Core grand public avec le Pentium 840 Extreme Edition. Ce processeur « Smithfield » se compose tout simplement de deux dies « Prescott 1 Mo » en 90 nm installés côte à côte… Cette solution a renforcé les points forts du Pentium 4, notamment les performances multimédia mais elle surtout fait ressortir son très mauvais côté, à savoir une consommation et une dissipation déraisonnables. Arrivés un mois plus tard, les Athlon 64 X2 ont d’emblée fait l’unanimité. Pas question de bricolage de dernière minute, l’Athlon 64 X2 est un vrai processeur Dual Core natif dont les deux cœurs d’exécution communiquent ensemble directement et partagent des ressources afin d’augmenter les performances. Intel a repris sa recette des deux dies pour commercialiser ses premiers processeurs Quad Core avant son concurrent. Un an plus tard, AMD revient avec le Phenom, le premier Quad Core natif…


Le principe interne simplifié de l'Athlon 64 X2Petit historique…

Quand AMD a lancé ses premiers Athlon 64 en support 754, le fondeur disposait d’une base saine : l’Athlon XP dérivé des premiers Athlon qui menaient la vie dure aux Pentium !!!. Pour faire court mais sans être péjoratif, l’Athlon 64 est un Athlon XP optimisé avec des registres 64 bits et dans lequel un contrôleur mémoire a été intégré. Cette intégration permet au Athlon 64 de tirer parti des meilleurs modules de DDR400 fonctionnant en CL2 et ainsi d’obtenir à fréquence égale des performances plus élevées que l’Athlon XP. Par la suite, l’Athlon 64 a gagné un contrôleur double canal pour suivre la tendance « Dual Channel ». Même si les gains sont relativement faibles, l’Athlon 64 socket 939 n’a fait que bonifier l’architecture K8. L’apogée arrive en mai 2005 avec l’Athlon 64 X2, le premier processeur Dual Core natif. Les cœurs d’exécution qui communiquent directement ensemble via le « Crossbar Switch » et partagent certaines ressources comme le contrôleur mémoire et le lien Hypertransport. Les Athlon 64 X2 sont performants, consomment et chauffent peu et pour ne rien gâcher, ils fonctionnent sur les cartes mères Socket 939.

Pipeline Intel des processeurs 45 nmSi les Athlon et les Pentium !!! rivalisaient réellement sur le plan des performances, le Pentium 4 a déçu. En effet, alors que les descendants des Athlon sont toujours arrivés sur le marché avec un gain de performances sur la génération précédente, les premiers Pentium 4 étaient plus lents que les derniers Pentium !!! et donc que les Athlon et Athlon XP. Ce n’est vraiment qu’avec le Pentium 4 « C » qu’Intel revient dans la course et donne un avant goût du confort des systèmes biprocesseurs grâce à la technologie HyperThreading. Alors qu’AMD bonifiait ses Athlon puis Athlon 64, Intel s’est enlisé dans une vaine montée en fréquence. Elle s’est soldée par une consommation incontrôlée et des performances en recul avec les Prescott (rebaptisés « Presque Hot ») et autres Presler… Paradoxalement, dans le monde mobile, Intel a bien vite compris que le Pentium 4 était une voie sans issue. Le fondeur a fait table rase « du passé proche » pour concevoir le Pentium-m. Il reprend une partie du Pentium !!! ainsi que les améliorations issues de Netburt. Le résultat est un cocktail détonnant que les utilisateurs de portables savourent depuis 2003… Les portables ont même eu droit au premier vrai processeur Dual Core d’Intel début 2006 avec les Centrino Duo alors que les Pentium D – les faux Dual Core à base de Prescott – étaient toujours de mise dans les ordinateurs de bureau… Tout bascule durant l’été 2006. Intel laisse enfin tomber les Pentium 4 et D au profit des Core 2 Duo. Ces derniers n’ont que des points forts : performances exceptionnelles, faible consommation, prix raisonnables et overclocking de très haut niveau. Un véritable raz de marée…

Au cours de l’ère Pentium 4, Intel a quand même réussi à « imposer » de nouvelles technologies notamment durant l’été 2004 avec le PCI-Express et la DDR2. Si la première a été très bénéfique pour AMD avec un succès énorme pour les configurations nForce4 en Socket 939, la seconde est à la source d’un premier coup de couteau dans le dos des Athlon 64 et Athlon 64 X2. En effet, la DDR2 n’est pas aussi bien adaptée au contrôleur mémoire intégré des Athlon 64 en raison d’une latence plus élevée (voir l’article Athlon 64 AM2). Pour la première fois, les performances de l’Athlon 64 ont reculé. Les Athlon 64 X2 AM2 n’ont d’ailleurs pas connu le succès de leurs aînés d’autant plus que tout le monde avait déjà les yeux tournés vers les Core 2 Duo… Le Phenom va-t-il renverser la vapeur ?


L’architecture du Phenom

Principaux blocs du PhenomEn regardant les diagrammes simplifiés de l’agencement interne d’un Athlon 64 X2 et d’un Phenom, les similitudes sont évidentes. Nous sommes bien en présence d’un processeur « quad cores » natif. Les quatre cœurs d’exécution du Phenom disposent de 512 Ko de cache L2 chacun et partagent un cache L3 inédit de 2 Mo. La communication interne est ensuite prise en charge par le « Crossbar Switch » et le « System Request Interface» comme sur les Athlon 64 X2. Enfin, le double contrôleur mémoire et le contrôleur Hypertransport 3 assurent les entrées et sorties. L’architecture d’AMD anciennement connue sous le nom de K10 a été renommée Stars. Et à l’image de son concurrent, AMD a amélioré son nouveau processeur à tous les niveaux.
  • Le premier point important pour un processeur est la lecture des instructions. Dans les Athlon 64 X2 (et des Core 2 Duo), le « Fetch » (ou la lecture) se fait sur 16 bytes. Afin que suffisamment d’instructions soient disponibles, le Phenom lit des blocs de 32 bytes mieux adaptés à une architecture à haut rendement.


  • La seconde phase est le décodage des instructions. Selon leur complexité, elles sont envoyées vers le « DirectPath » si elles ne se traduisent que par une ou deux micro opérations ou le « VectorPath » si elles en demandent 3 ou plus. Lors de chaque cycle, l’unité de décodage peut sortir au moins trois micro opérations via le DirectPath. Le débit du VectoPath est quant à lui tributaire de la complexité de l’instruction. De son côté, le Core 2 Duo dispose de 4 décodeurs : 3 simples et 1 complexe.

  • Un point clef du bon fonctionnement des deux unités précédentes (ainsi que des suivantes) est le Prefetch. Il s’agit en quelques sortes d’anticiper afin de préparer directement les prochaines données et instructions nécessaires à l’exécution du programme. Par rapport à l’Athlon 64, le Phenom peut directement charger des instructions dans le cache L1 grâce à son « Advanced Memory Prefetcher ». La politique « when and where » des Core 2 Duo se retrouve un peu dans les Phenom qui peuvent eux aussi faire arriver leurs données et instructions où il faut (le « bon niveau de cache ») et quand il faut (ni trop tôt ni trop tard) afin de ne pas « polluer » le cache avec des données et instructions inutiles. Enfin, un système de « prefetch » est également intégré au contrôleur mémoire. Même si les mécanismes de prefetch ont évolué avec le Phenom, ils sont encore loin des raffinements du Smart Memory Access qui se trouvent dans Core. Il faut souligner que les Core 2 Duo (et Core 2 Quad) sont des dérivés des Core Duo déjà fortement optimisés et que ces derniers descendent des Pentium-m universellement reconnus pour leur architecture particulièrement efficace...

    Diagramme d'un core du Phenom

  • Représentation plus orienté pipeline d'un core du Phenom.Les micro opérations arrivent ensuite dans le Reorder buffer (ROB) via l’Instruction Control Unit. Le ROB nécessaire à l’exécution Out-Of-Order a une capacité de 72 micro opérations. Ici encore, cette capacité est relativement modeste à côté des 96 entrées de l’architecture Core. Le Speculative Out-of-Order Load Execution du Phenom est comparable à la technologie Memory Disambiguation et permet de découpler les opérations de load et store. Toujours au chapitre des optimisations, le « Sideband Stack Optimizer » est comparable au Stack Pointer Tracker de l’architecture Core. Grosso modo, ils s’agit de réorganiser les instructions de la pile (stack) afin d’obtenir une suite plus rapide à traiter.

  • Le cheminement continue ensuite vers l’ALU (Arithmetic Logic Unit) ou vers la FPU (Floating Point Unit). Côté ALU, les trois pipelines sont identiques avec chacun leur unité d’adressage. Cependant, le pipeline 0 dispose en plus d’une unité MUL et le 2 reçoit une unité spécifique pour deux nouvelles instructions (LZCNT et POPCNT). AMD n’a pas donné de précisions sur d’éventuelles modifications internes des pipelines eux-mêmes. La FPU 80 bits compte également trois pipelines d’exécution mais ils ont chacun un rôle spécifique : FADD, FMUL et FSTORE (addition, multiplication et store). Si l’ALU n’a pas changé, la FPU dispose à présent de deux unités SSE 128 bits contre 1 seule 80 bits dans l’Athlon 64. Les buffers ont bien entendu été adaptés en conséquence. L’unité FSTOR n’est à présent plus réquisitionnée lors des opérations SSE. Elle reste donc disponible pour certaines opérations notamment les MOV. A noter qu’AMD a introduit un jeu d’instructions SSE4A propriétaire différent du « SSE4 » introduit par Core.

  • La prédiction de branchement intervient de manière significative dans les performances. Lors d’un choix conditionnel dans un programme, une branche sera exécutée selon le résultat d’un test. Il est important de savoir le plus rapidement possible l’issue du test conditionnel. Si les Athlon peuvent prévoir les branchements directs, les Phenom sont en mesure de prévoir les branchements indirects. Il faut noter que de son côté, Intel est passé maître dans cet art depuis les Pentium 4 dont le vidage du long pipeline était terriblement pénalisant en cas d’erreur de prédiction…

  • A la sortie des différents pipelines, tout est remis dans l’ordre dans le Memory Reorder Buffer (MOB).


  • Les caches

    Intel bénéficie d’une certaine avance au niveau de la technologie de gravure. Le fondeur a donc passé le cache L2 de ses processeurs à 6 Mo unifiés par Core. AMD se limite à 512 Ko de cache par core d’exécution mais compense avec un cache commun L3 de 2 Mo. Au niveau du cache L1, le Phenom embarque 64 Ko pour les données et de 64 Ko pour les instructions pour chaque core. Les trois niveaux de cache du Phenom sont de type exclusif. En d’autres mots, ce qui est dans un niveau de cache n’est jamais dupliqué. Cette approche permet de maximiser la mémoire cache disponible. En contrepartie, il faut très souvent faire migrer les données d’un cache à l’autre. Cependant, pour optimiser les applications multithreads, le cache L3 peut conserver des données et/ou instructions souvent utilisées.

    Nous avons utilisé RightMark Memory Analyser pour étudier le comportement du cache du Phenom afin de le comparer à celui de l'Athlon 64 et du Core 2 Quad en 45 nm. L'analyse port sur la latence du cache et le taux de transfert de la mémoire.


    Le plus bas sur la plus grande plage est idéal : Athlon 64, Phenom, Core 2 Quad.

    En comparant les caches, on constate que l’emploi d’un cache L3 n’est pas une solution intéressante face à un gros cache L2. En effet, alors que le processeur Intel en 45 nm a accès à 6 Mo de données en moins de 10 cycles, le Phenom n’a accès qu’à 576 Ko (en non 512 Ko en raison du mode exclusif) aussi rapidement. De 576 Ko à 2624 Ko, les données sont accessibles en 20 cycles. Au-delà, il faut plus de 40 cycles au Phenom contre moins de 30 au Yorkfield.


    Le plus haut sur la plus grande plage est idéal : Athlon 64, Phenom, Core 2 Quad.
    ATTENTION à l'échelle du Core 2 Quad deux fois plus basse !

    Au niveau de la bande passante pure, les Athlon 64 et Phenom sont exceptionnels lors de la lecture des caches L1 et L2. En écriture, les performances sont comparables à celles de leur concurrent. Une fois encore, le Yorfield conserve l’avantage en raison de son plus gros cache L2. Hors des caches (après 6 Mo pour le Yorkfield et 2,6 Mo pour le Phenom), la mémoire elle-même lisse les performances…


    Le contrôleur mémoire

    Depuis l’Athlon 64, le contrôleur mémoire est intégré au processeur (et donc plus dans le Northbridge). Le Phenom en 65 nm embarque toujours un contrôleur DDR2 mais il inaugure deux modes de fonctionnement : ganged et unganged. En mode ganged, le contrôleur 128 bits travaille de manière totalement conventionnelle comme dans l’Athlon 64. Lors du fonctionnement ungaged, il fonctionne comme deux contrôleurs 64 bits distincts. Ce dernier mode est mieux adapté aux opérations multithreads les car les deux contrôleurs peuvent agir de manière indépendante (asymétrique) et plus de manière identique (symétrique). L’un peut lire pendant que l’autre écrit, ce qui est impossible avec un contrôleur 128 bits classique.


    Contrairement à l’Athlon 64 X2 AM2 qui est incapable de fournir toutes les fréquences standardisées au niveau du bus mémoire (en raison de l’absence de certains ratios), le Phenom supporte correctement et sans perte de bande passante les DDR2-400, DDR2-533, DDR2-667, DDR2-800 et même DDR2-1066. Dans les Phenom 9500 et 9600, le contrôleur mémoire travaille à 1800 MHz. A l’avenir, AMD prévoit de porter la cadence à 2000 MHz pour les Phenom plus rapides.


    Cool and Quiet 2

    Le Phenom introduit une nouvelle version de la technologie Cool and Quiet inaugurée par les Athlon 64. Chacun des cores du nouveau processeur peut faire varier sa fréquence et donc sa tension selon sa charge de travail. Quand toutes les unités d’exécution du Phenom sont au repos, le processeur peut entrer dans le mode C1E dans lequel les liaisons HyperTransport sont arrêtées et la mémoire mise en mode veille. Grâce au « split-plane », le contrôleur intégré et les cores sont alimentés de manière indépendante, ce qui permet une gestion très fine de l’énergie. A noter que le concurrent d’AMD n’est pas en reste au niveau de la gestion de l’énergie et que depuis le Pentium-m, les processeurs Intel peuvent également couper une partie du bus de communication avec le chipset. Enfin, comme les Core 2 Duo, les Phenom ont de nombreuses diodes de mesure de la température afin de veiller au bon fonctionnement du processeur. La « Coolcore Technology » est également en mesure de modifier rapidement et finement les fréquences et les tensions afin d’éviter d’éventuelles surchauffes de certaines zones.


    Un gros morceau !

    Le Phenom utilise le support AM2+ mais reste compatible avec le support AM2. Sur le plus ancien connecteur, il perd cependant certaines fonctionnalités comme le « slip-plane » et le contrôleur mémoire reçoit la même tension d’alimentation que le reste du processeur. Ce dernier perd 200 MHz dans l’opération et fonctionne à 1600 MHz au lieu de 1800 MHz. Extérieurement, le Phenom et l’Athlon 64 X2 sont identiques. Avec 4 cores d’exécution dotés chacun de 128 Ko de cache L1 et de 512 Ko de cache L2 et un grand cache L3 commun de 2 Mo, le Phenom compte 463 millions de transistors qui occupent pas moins de 285mm² ! Etant un Quad Core natif, le die est naturellement d’une seule pièce et au moindre défaut, le Phenom X4 part « au rebut » ou plus précisément devient un (futur) Phenom X3 ou X2… De son côté, Intel qui « colle » deux dies de Core 2 Duo de 143mm² (65nm) ou 107mm² (45nm) pour obtenir un Quad Core ne court pas le risque de perdre un die si complexe.



    L’araignée se casse une patte !

    La partie théorique étant (enfin) bouclée, il reste à passer à la pratique ! Curieusement, après nous avoir demandé si nous avions tout le nécessaire pour tester un Phenom, AMD nous a fait parvenir une machine complète alors qu’une carte mère et un processeur auraient suffi. Pourquoi donc nous demander notre avis avant ? Certainement pour tester la nouvelle plateforme Spider qui se compose d’un AMD Phenom, d’un chipset AMD Série 7 et d’une AMD Radeon HD 3800... Malheureusement, notre araignée s’est cassée au moins une patte lors du transport ! En effet, le disque dur se baladait dans la tour… En outre, la plateforme Spider était installée dans une tour NZXT de bien piètre qualité et le montage lui-même laissait franchement à désirer ! On peut par exemple signaler le ventilateur « butterfly » qui envoyait l’air chaud vers le bas avec un flux inversé par rapport à celui induit par l’alimentation, des câbles baladeurs, des ventilateurs bruyants, etc. Par rapport à nos machines, le NZXT est déjà une calamité sonore à lui seul… De curieux choix pour un système de démonstration « Cool and Quiet 2 » qui se veut Quiet (silencieux) ! Il ne s’agit cependant que du début de nos soucis. La carte mère GA-MA790FX-DQ6 n’a jamais fonctionné autrement qu’en mode unganged. En outre, le Spider ne démarrait qu’avec des modules dans les banques 0 et/ou 2… Après avoir perdu une journée à tester différents kits de mémoire et toutes les versions du BIOS proposées par le site de Gigabyte, nous avons conclu à un autre dommage lié au transport. HiTech PC (et ShS Computer un Athlon 64 X2 4400+) nous a heureusement prêté une Asus M3A32-MVP et tout est enfin rentré dans l’ordre. Cette carte mère est d’ailleurs nettement plus évoluée que le modèle Gigagyte avec un BIOS non seulement plus complet mais également beaucoup plus explicite au niveau des options…A noter toutefois que dans un cas comme dans l’autre, l’explication des paramètres du BIOS est très laconique.


    Asus M3A32-MVP

    La plateforme Spider est un trio dont nous connaissons déjà la partie graphique depuis le test des Radeon HD 3800. Nous avons déjà longuement analysé le Phenom, il reste à toucher quelques mots sur le chipset AMD 790 FX couplé au SB600. Grâce au nortbridge 790FX, la M3A32-MVP est équipée de 4 port PCI-Express 2.0 pour le CrossFireX™. Ils fonctionnent en 16x + 16x (2 cartes), 16x + 8x + 8x (3 cartes) ou 8x + 8x + 8x + 8x (4 cartes). A ce sujet, on peut regretter qu’AMD se soit contenté de ne fournir qu’une seule carte graphique Radeon HD 3870 pour évaluer sa plateforme… Le SB600 gère quant à lui 4 ports SATA 3Gb/s (sans RAID 5), un connecteur ATA133, 10 prises USB 2.0 et l’High Definition Audio.


    Configuration de test

    Nous n’avons finalement utilisé que le Phenom 9600 et la Radeon HD 3870 envoyés par AMD, tous les autres composants étant issus de notre labo. L’installation de la machine de test n’a posé aucun problème. Au niveau logiciel, l’Overdrive d’AMD est un utilitaire vraiment sympathique. Il permet de gérer tous les paramètres du Phenom dont de très nombreux à la volée. L’Overdrive autorise par exemple le réglage manuel de la fréquence de n’importe quel core. Véritable boîte à outils, le logiciel d’AMD fait également office de programme de monitoring et d’utilitaire d’overclocking. Il est cependant limité dans cette tâche où la montée en fréquence est réduite et la modification via le BIOS reste incontournable. Quoi qu’il en soit, l’Overdrive est une réelle valeur ajoutée à la plateforme Spider.

    Matériel
  • Asus P5K Pro (P35) et Asus M3A32-MVP (790 FX)
  • Core 2 Duo 45 nm @ 2333 MHz, Phenom 9600 (2300 MHz), Athlon 64 X2 4400+ (2300 MHz)
  • Transcend aXeRAM 2 x 1 Go DDR2-800 4-4-4-12
  • Radeon HD 3870
  • Western Digital Caviar 500 Go SATA-150
  • Dell 2407WFP
  • Coolink Silentator avec 120 mm à 750 rpm
  • Lian Li PC-B20B
    Logiciel
  • Windows XP + DirectX update
  • Catalyst 7.12
  • CPU Mark
  • Super Pi
  • 7Z
  • Crystal Mark
  • Cinebench 9.5 & 10
  • Everest Ultimate
  • DVD Shrink
  • World In Conflict (1280x800 moyen)
  • Crysis (1280x800 moyen)
  • Quake IV (1650x1080 HQ)
  • 3D Mark 2006 défaut


    Performances


    Notre première séance de mesures a pour but d’examiner les éventuels écarts de performances entre les modes ganged et unganged. Les résultats nous laissent perplexes : aucun mode ne semble clairement avantageux… Des écarts apparaissent probablement de manière significative dans le cadre d’une utilisation en tant que serveur. Il ne faut en effet pas perdre de vue que le Phenom et l’Opteron partagent la même architecture. Accessoirement et à notre grande surprise, le Phenom est à peine pénalisé par le fonctionnement en simple canal ! Il faut souligner que lors de notre comparatif des modules de DDR2-800, nous avions déjà constaté des écarts anecdotiques dans le cas d’un Core 2 Duo en single et dual channel…


    Nous ne tournerons pas autour du pot, si les performances du Phenom sont plus élevées à fréquence égale que celle de l’Athlon 64 X2, le dernier des processeurs AMD ne parvient pas à rivaliser avec un Penryn à 2,33 GHz. Ce dernier a certes un avantage de 30 MHz mais ils n’expliquent pas l’énorme avance du processeur Intel sur son concurrent. En outre, avec seulement 100 MHz de plus que le Phenom 9500 soit ~5%, le Phenom 9600 est à peine plus performant que son petit frère. L’écart est d’ailleurs tellement faible que sur les tests où la variance est élevée, il n’est pas rare que le meilleur score obtenu par le Phenom 9500 dépasse le moins bon atteint par le Phenom 9600. C’est notamment le cas des résultats de Crysis (dont nous présentons une moyenne de 5 mesures)…


    Par rapport à l’Athlon 64 X2 4400+, le Phenom 9600 qui fonctionne à la même fréquence est jusqu’à 30% plus performant dans les applications mono thread (World In Conflict). On constate aussi un très gros gain lors de l’usage intensif des instructions SSE2 (score « mono » CPU de 3D Mark 2006). L’indice CPU Mark augmente quant à lui de 15% et le temps de calcul de Pi baisse de 10%. Lors du test mono thread des Cinebench, le Phenom stagne par rapport à son aîné. En comparaison avec le Core 2 Quad à 2,33 Ghz, le Phenom ne marque des points qu’au niveau du « speed up » de Cinebench R10. En effet, en passant d’un rendu d’un à quatre cores, les performances des Phenom sont multipliées par 3,8 alors qu’elles ne le sont que par 3,5 pour le Core 2 Quad. Une bien maigre consolation étant donné que le processeur Intel est largement plus performant dans ce test comme dans tous les autres soit dit en passant…


    En fait, AMD a beau se moquer de son concurrent a propos de ses Quad Core non natifs, Intel dispose d’une architecture terriblement efficace qui synthétise toutes les connaissances acquises avec les différentes générations de Pentium en y ajoutant de nombreuses optimisations… La partie théorique de l’article a montré que dans bien des domaines, AMD n’a fait que d’ajouter des optimisations qu’Intel utilise déjà dans les Core 2 Duo et Core 2 Quad voire même dans les anciens Pentium 4.


    IPC, branch prediction, retired Instruction et cache hit (ajout du 27/12)

    Les tests ont montré que l’architecture Core est plus efficace que Stars. En lisant les documents d’AMD, en examinant la documentation et en étudiant d’autres articles techniques sur le Phenom, je me suis personnellement interrogé sur les causes des différences de performances. J’avais la conviction que les optimisations étaient moindres dans Stars mais une conviction n’est pas une preuve… Comment mettre en évidence les améliorations internes apportées par AMD en passant du K8 au K10 et comment les comparer à celles des processeurs Intel ? La réponse s’appelle PerfMonitor, un petit utilitaire conçu par le génial programmeur Franck Delattre auteur notamment de CPU-Z. Ce logiciel permet d’étudier les instructions traitées par cycle et par seconde, l’efficacité de la prédiction de branchement, les « retired instructions » (instructions réellement sorties du pipeline) et le cache hit rate (le taux de réussite des caches). Les logs de PerfMonitor se lancement manuellement via la touche F5, ce qui augmente un peu la marge d’erreur. En outre, étant donné qu’il date de 2006, toutes les fonctionnalités ne sont pas accessibles (en même temps) sur tous les processeurs. Cependant, PerfMonitor m’a permis de vérifier plusieurs choses importantes.
  • ICP : L’Athlon 64 X2 4400+ est en mesure de traiter dans une application mono thread 0,8 instruction par cycle. C’est le cas dans la majorité des applications. Dans les applications multi threads comme Cinebench 9.5 ou Prime95, il atteint 1,2 instruction par cycle et par core d’exécution. Le Phenom 9600 traite de 1,1 à 1,6 instruction par cycle et par core. Le Core 2 Quad utilisé ici à 2,33 GHz traite de 1,3 à 1,6 instruction par cycle et par core.
  • Retired Instruction : L’Athlon 64 débite de 1800 à 2500 M instructions retirées par seconde. Le Phenom traite de 2500 à 3500 M instructions par seconde, il est généralement 10% plus rapide que l’Athlon 64 X2 mais il peut se montrer jusqu’à 60% plus véloce ! Quand au Core 2 Quad, il traite de 2700 à 3500 M instructions par seconde. Si le maximum est identique, en moyenne, le Core 2 Quad à 2,33 GHz est généralement 10% plus rapide que le Phenom 9600.
  • Cache hit rate : Le logiciel ne propose malheureusement pas de mesure identique sur les architectures Intel et AMD. Cependant, en se rabattant sur d’autres mesure, les hit rate est toujours très élevé et dépasse les 96%.
  • Branch Prediction : La prédiction de branchement fait gagner beaucoup de temps de calcul et intervient de manière importante dans les performances. AMD a bien amélioré l’unité du Phenom dont le taux de succès varie de 98,5% à 96,5% contre 94,1% à 95,5% sur l’Athlon 64. Intel de son côté maîtrise totalement cette technique et le Core 2 Quad oscille entre 99,1% et 99,3%. En de très rare occasion, il descend à 95% mais dans certains cas, il réussit aussi 100% des prédictions !
  • Avec en moyenne 1,13 IPC, 96% de prédictions de branchement correctes et 26 M instructions retirées par seconde, l’architecture Stars du Phenom 9600 améliore les performances intrinsèques de l’architecture K8 Athlon 64 X2 4400+ AM2 (respectivement 1,05 IPC, 94,5% branch prediction true et 2400 Mir/s). Particulièrement efficace, l’architecture Core atteint 1,31 IPC, 99% de branchements corrects et 28,5 Mir/s. Ces moyennes confirment que le cœur d’exécutions des Core 2 Duo et Core 2 Quad est de 10 à 15% plus performant. PerfMonitor ne permet malheureusement pas d’étudier le comportement des instructions SSE sur le processeur Intel…


    Consommation, bruit, chaleur et overclocking…

    Côté consommation, nous attendions quand même mieux. Avec 4 instances de Prime95, la plateforme Spider avec un Phenom 9600 consomme 33% de plus que le Penryn à 2,33 GHz monté sur une Asus P5K Pro avec un Radeon HD 3870. Au repos, la situation tourne encore plus à l’avantage du processeur Intel avec un écart de 44%. Il n’y a qu’avec Prime95 et le 3D Mark 2006 de concert que l’écart tombe à moins de 18%.


    La machine envoyée par AMD est très bruyante, un comble pour montrer l’avantage du Cool and Quiet 2 ! Equipé d’un Noctua NH-U12P, le Phenom est silencieux… Mais qu’en sera-t-il avec le radiateur livré avec le modèle box ? Curieusement, le logiciel Overdrive n’a pas été en mesure de lire les températures des cores du Phenom sur l’Asus M3A32-MVP. Asus PC ProbeII et Everest ne rapportaient qu’une seule valeur, probablement celle de la sonde de la carte mère, mais cette dernière variait à peine… Pourtant, le BIOS accélérait la vitesse du ventilateur lors des mises en charge, ce qui témoigne d’une montée en température.

    L’overclocking du Phenom se fait via le « HT Link » repris en tant que FSB dans le BIOS. Avec sa tension d’origine, le Phenom supporte un bus de 233 MHz au lieu de 200 Mhz par défaut. La fréquence finale atteint ainsi 2679 MHz soit un gain de 22%. Etant donné qu’il s’agit d’un processeur en première révision, le résultat est tout à fait correct. Cependant, ce gain est bien maigre à côté de celui obtenu sur les Core 2 Duo et Core 2 Quad… A noter que notre processeur démarrait encore avec un bus à 240 MHz (2760 MHz) mais que des erreurs se produisaient souvent sous Windows. Augmenter la tension s’est soldé par une impossibilité de démarrer et non par la stabilisation du système.


    Conclusion

    Quand nous avons commencé la rédaction de la partie théorique, nous avons dans un premier temps été enthousiasmés par l’approche retenue par AMD pour réaliser le premier processeur quad core natif. L’architecture du Phenom est aussi « propre » que celle des Athlon 64 X2 et l’emploi de trois niveaux de cache est une solution élégante. Cependant, en passant en revue les différentes optimisations qui, selon AMD font du Phenom un processeur de dixième génération et non de neuvième, tout a un air de déjà vu. En effet, de nombreuses améliorations introduites avec le Phenom existent déjà dans les Core Duo et leur évolution Core 2 Duo. En outre, elles ne sont ou du moins ne semblent pas aussi bien implémentées que dans les processeurs Intel. Et c’est bien là que le bât blesse. Le Phenom utilise certaines améliorations pour la première fois alors qu’Intel les a déjà employées avec les Core Duo pour les améliorer encore avec les Core 2 Duo. Si elles permettent au Phenom d’être plus efficace que l’Athlon 64, elles ne suffisent pas face à la concurrence. Les Core 2 Duo restent donc de très redoutables adversaires invaincus ! En outre, le bug du TLB même si nous ne l’avons pas rencontré ne joue pas en faveur des actuels Phenom.

    Malheureusement, le bilan est également peu brillant au niveau du rapport prix/performances. Si les Phenom 9500 et 9600 devraient normalement se négocier à présent aux alentours de 200 € et 240 €, le surcoût pour le modèle 9600 est totalement injustifié compte tenu de l’augmentation marginale des performances. Il reste cependant à savoir quand Intel proposera ses Quad Core Penryn et à quels prix. Quoi qu’il en soit, étant donné que le Q6600 vaut aujourd’hui moins de 250 €, on peut au grand dam d’AMD supposer, qu’un futur Penryn 2,33 GHz sera encore moins cher tout en étant toujours plus performant…
    Si les Radeon HD 3800 (testées dernièrement) de la plateforme Spider nous ont laissé une bonne impression, le chipset de cette même plateforme est un peu déséquilibré. Le récent 790FX est appairé à un SB600 qui sent la naphtaline… Etant donné l’intérêt grandissant des utilisateurs envers les Radeon HD 3800, on peut logiquement penser que ceux qui préfèrent une Radeon à une GeForce et veulent un Phenom n’iront certainement pas acheter une carte mère à base de nForce et seront donc des clients « Spider ». Certes, il faut vouloir un Phenom plutôt qu’un Core 2 Duo mais pourquoi pas...

    AMD Phenom : 6,5/10
    Pour :
    compatible avec le support AM2, logiciel Overdrive, fréquences indépendantes des cores, quad core natif…
    Contre : … mais sans intérêt pratique, performances moyennes dans l’absolu et faibles par rapport à la concurrence, Phenom 9600 à peine plus puissant que le 9500 mais beaucoup plus cher, bug du TLB
  •