Home Tests Hardware Top chrono : Intel Core i7 Extreme 965, benchs & overclocking

Top chrono : Intel Core i7 Extreme 965, benchs & overclocking

Imprimer Envoyer
Note des utilisateurs: / 0
MauvaisTrès bien 
Écrit par Pascal Thevenier   
Lundi, 03 Novembre 2008 06:33
L’architecture Core des processeurs Core 2 Duo lancés en juillet 2006 a très vite fait oublier NetBurst ainsi que les peu glorieux derniers Pentium 4 et Pentium D. Grâce à l’expérience acquise avec les Pentium-m et les Core Duo, Intel proposait enfin des processeurs de bureau combinant performances de premier plan, faible consommation, dissipation thermique contenue et capacités d’overclocking élevées. Les Core 2 Duo et dans une moindre mesure les Core 2 Quad ont ainsi connu un succès fulgurant. Malgré ses qualités encore renforcées par le passage au 45 nm, l’architecture Core souffre d’un défaut qui commence à être pénalisant : l’incapacité d’augmenter le nombre de cœurs d’exécution... Après avoir étudié l’architecture Nehalem qui comble cette lacune, il est temps de se pencher sur les performances des premiers Core i7…


Nehalem la modulaire…

Dans le cadre d’un processeur Dual Core, l’architecture Core ne souffre pas vraiment de défauts, que du contraire. Cependant, elle n’a pas été conçue pour multiplier les cœurs d’exécution. En fait, Core est parfaite pour des processeurs de type Dual Core mais pas (beaucoup) plus. En effet, pour ses Core 2 Quad, Intel s’est contenté de monter deux dies de Core 2 Duo sur un même support comme il l’avait déjà fait avec les Pentium D. AMD a ainsi qualifié les premiers Core 2 Quad de bricolages car avec ses Phenom, le fondeur texan a été le premier à proposer de « vrais » processeurs Quad Core natifs… L’évolution des processeurs passant à présent plus par la multiplication des cores que par la montée en fréquence, il devenait capital pour Intel de tourner la page…

L’architecture Nehalem a été élaborée principalement dans une optique de modularité tout en introduisant des augmentations de performances et en conservant la consommation la plus faible possible. Si au cœur du processeur, le pipeline d’exécution est proche de celui de l’architecture Core, de très nombreuses améliorations ont été apportées aux caches, à la prédiction de branchement, etc. Nehalem met également en œuvre un cache de niveau 3 (déjà utilisé par le passé notamment par le Pentium 4 Extreme Edition 3.46GHz « Gallatin » ) et transfère le contrôleur mémoire du northbridge vers le processeur (comme dans le cas des Athlon 64).


Le Core i7 Extreme 965

Nous avons reçu d’Intel le fleuron de l’architecture Nehalem : Core i7 Extreme 965 à 3200 MHz. Comme les autres modèles de la gamme Core i7, il utilise un Socket de type LGA – comparable à celui des Core 2 Duo – mais le nombre de contacts passe de 775 à 1366. Il est donc totalement impossible de remplacer un Core 2 Duo par un Core i7 : ce n’est possible ni au niveau logique, ni au niveau physique… Le support LGA 1336 étant plus grand, il faudra même remplacer les fixations du système de refroidissement…

Avec 4 unités d’exécution dotées de la technologie HyperThreading, pas moins de 8 Mo de cache L3, un contrôleur thermique comparable à un 486 ainsi qu’un triple contrôleur mémoire embarqué, les Core i7 se composent de 731 millions de transistors. A titre indicatif, les Core 2 Quad de la génération Penryn se composent de 820 millions de transistors, 410 millions par core… Face aux 107 mm² d’un Core 2 Duo (x2 pour un Core 2 Quad), le die du Core i7 mesure 263 mm². Il s’agit du plus gros die monolithique (d’une pièce) produit par Intel depuis les Pentium en 1992 (294 mm²) et Pentium Pro en 1994 (306 mm²). Il est donc important pour Intel de passer assez rapidement à une gravure en 32 nm…

Au niveau des fréquences, le Core i7 Extreme 965 travaille en interne à 3200 MHz sous la forme 24 x 133 MHz. Attention, en raison du passage du FSB Quad Pumped des générations Core et Neburst au nouveau bus QPI, les fréquences de « FSB » ne sont pas directement comparables. Grâce au mode Turbo (Intel Dynamic Speed Technology dans le BIOS de l’Intel DX58SO), le multiplicateur propre à chaque core peut monter jusqu’à 27 (valeur modifiable), soit une fréquence de 3600 MHz. A noter que les cores peuvent fonctionner à des fréquences différentes selon leur charge de travail.


Configuration de test

Intel nous a fait parvenir un Core i7 Extreme 965 (3200 MHz) avec une carte mère Intel DX58SO, un SSD Intel X25-m et trois modules de 1 Go de DDR3 1066 MHz en 7-7-7-20 (puces Qimonda). Les tests ont été réalisés avec et sans le mode Turbo. Enfin, pour le refroidissement, le kit comporte un radiateur « Intel box » et un Thermaright Extreme 120 LGA-1366 edition. C’est lui que nous avons retenu pour les mesures. Pour comparer, nous avons fait appel à notre machine de référence avec un Core 2 Extreme QX9770 (3200 MHz) monté sur une Asus P5Q Deluxe avec 2 x 2 Go de DDR3 1066 MHz réglés avec les mêmes timings. Nous avons bien entendu également équipé cette machine du SSD X25-m.


Matériel
  • Asus P5Q3 Deluxe, Intel DX58SO
  • Core 2 Extreme X9770 et Core i7 Extreme 965
  • Corsair XMS3-1600 Dominator @ 1066 MHz CL7 2 x 2 Go, Qimonda DDR3 1066 MHz CL7 3 x 1 Go
  • Radeon HD 4870
  • Western Digital Caviar 500 Go et Intel X25-8 80 Go (système)
  • Dell 2407WFP
  • Noctua NU-U12P et Thermaright Extreme 120 LGA-1366 edition
  • Lian Li PC-B20B

    Logiciel
  • Windows XP SP3 + DirectX update
  • Intel Inf update 9.0.0.1008
  • Catalyst 8.10
  • CPU Mark
  • Wprime
  • Fritz Chess Benchmark
  • DVD Shrink
  • MainConcept Reference 1.6
  • Cinebench R10
  • World In Conflict
  • Enemy Territory : Quake War
  • Crysis
  • 3D Mark 2006
  • Right Mark Memory Analyzer


    Performances


    CPU Mark est un vieux bench single thread mais nous l’utilisons toujours car il est sensible à de nombreux paramètres. Premier point intéressant à relever, l’indice du Core i7 Extreme 965 est 7,4% plus élevé que celui du Core 2 Extreme QX9770 à fréquence égale. Cet indice montre d’emblée que les améliorations introduites par les ingénieurs d’Intel sont payantes. Avec son mode Turbo, le Core i7 peut passer à 3600 MHz sans encombre lors de ce test. L’indice grimpe alors de 494 à 555 soit un gain de 12,34%. Par curiosité, nous avons augmenté dans le BIOS le multiplicateur Turbo de 27 à 29, ce qui a conduit à un plantage. Avec une valeur de 28, le résultat variait de 500 à 595 ! On peut supposer que cette variation est liée au pilotage thermique du processeur. Il ne faut pas perdre de vue qu’un multiplicateur de 28 conduit quand même le core actif à une fréquence de 3733 MHz !



    Pour faire plaisir à nos fans d’overclocking, nous avons aussi utilisé Wprime en 1024. Dans ce test, c’est le Core 2 Extreme qui prend l’avantage. Le logiciel a attribué 4 threads simultanés dans les deux cas (même si le Core i7 dispose de 8 processeurs logiques). On peut noter que Wprime stresse visiblement suffisamment le Core i7 pour ne pas permettre le passage en mode Turbo. Il reste à savoir pourquoi le Core i7 se montre moins rapide que le Core 2. Une piste probable est que chaque core jonglerait « inutilement » avec son second processeur virtuel (HyperThreading)…



    Fritz Chess Benchmark est une petite application qui calcule les coups d’une partie d’échecs. Nous avons réalisé le test avec de 1 à 4 ou 8 threads afin d’examiner l’évolution des performances. Le Core i7 sans Turbo et le Core 2 suivent une progression identique de 1 à 4 threads. Avec plus de 4 threads, la progression des Core i7 est nettement moins rapide. En effet, ce ne sont plus des processeurs physiques mais bien les processeurs logiques qui entrent en lice…
    En étant observateur, on constate une petite « perte » de performances quand le Core i7 utilise 4 threads. Dans ce cas précis, les Core 2 Extreme Q9770 et Core i7 Extreme 965 avec ou sans Turbo affichent pour ainsi dire le même score.
    Ce teste illustre assez clairement le potentiel du mode Turbo… Il faut cependant noter que le « turbo gain » n’est pas absolu et le résultat mesuré ici ne peut être transposé à toutes les applications.
    Pour la petite histoire, un Pentium !!! 1 GHz obtient un indice de 840 tandis que le Core i7 Extreme flirte avec les 13 000…



    DVD Shrink est toujours très utilisé pour compresser un DVD. Mais comme beaucoup de logiciels (voir le test de la Skull Trail), il n’est pas capable d’utiliser plus de 4 threads. Ainsi, les écarts observés pour compresser le film Dracula au maximum ne sont que de l’ordre de quelques secondes sur grosso mode 2 ½ minutes. Le mode Turbo ne présente ici aucun avantage significatif…



    MainConcept Reference est un logiciel d’édition vidéo capable d’utiliser tout le potentiel du Core i7. Avec ce logiciel (version 1.6) très récent et optimisé pour les processeurs multi cores, les gains sont impressionnants. Le Core i7 Extreme sans Turbo est 40% plus rapide que le Core 2 Extreme QX9770. Le Turbo booste encore les performances de 12,96% et conduit l’écart avec le processeur de la génération précédente à presque 5 images par seconde de plus soit +59% !!!



    Cinebench R10 permet aussi de montrer le potentiel de Nehalem. Lors du rendu sur un seul core, les scores obtenus sont tous très proches. Comme avec Fritz Chess Benchmark en mono thread, le turbo ne semble pas s’activer d’emblée. La charge de travail serait-elle considérée comme trop légère que pour activer la montée en fréquence ? Trop élevée pour être limitée par la gestion thermique, certainement pas car quand tous les cores sont actifs le gain est bien présent. Un « Turbo lag » ? Peut-être… En charge et avec 8 threads, le gain du mode turbo dépasse de peu les 12%. Par rapport à Core, Nehalem est au moins 21% plus rapide et jusqu’à 37,5% plus véloce avec le Turbo.







    Côté jeux, nous avons testé World In Conflict, Enemy Territory : Quake War et Crysis en faible résolution avec peu de détails et avec les réglages poussés au maximum. Bien entendu, personne n’utilise les réglages plus faibles en pratique. Ils servent uniquement à montrer ce que le processeur a dans le ventre. Avec les réglages extrêmes, les utilisateurs avertis sauront à quoi s’en tenir (même si dans ce cas on sait que la carte graphique devient le frein). Le mode Turbo apporte généralement un petit plus même en haute résolution. Crysis étant le plus gourmand au niveau graphique, en haute résolution, les performances stagnent avec le Core i7 même avec le Turbo actif. Comme nous le pensions, pas de coup de pied au cul dans les jeux vidéo… A noter que très peu de jeux chargent totalement un simple processeur Dual Core.




    Pour terminer, on constate que 3D Mark 2006 ne tire par un énorme avantage du Core i7...


    Impact des contrôleurs mémoire

    Attention : RMMA produit des graphes avec des échelles adaptées à chaque mesure. Elles sont donc différentes d'un graphe à l'autre.


    Bande passante du Core 2 Extreme QX9770


    Bande passante du Core i7 Extreme 965

    Le Core i7 Exterme 965 dispose de trois contrôleurs mémoire DDR3. En raison de ses contrôleurs embarqués (et plus dans le northbridge), avec un seul canal, le Core i7 profite déjà d’une bande passante plus élevée que le Core 2 Quad ! En peuplant deux banques et donc en dual channel, les taux de transfert augmentent de l’ordre de 50%. Par contre, le gain apporté par le troisième canal est assez limité. En lecture, la progression est très faible mais en écriture, il tourne autour de 40% !

    Attention : les trois graphes suivants ont la même échelle mais il faut se focaliser sur les valeurs après 16 Mo (hors cache).


    Bande passante du Core i7 Extreme 965 : 1 contrôleur


    Bande passante du Core i7 Extreme 965 : 2 contrôleurs


    Bande passante du Core i7 Extreme 965 : 3 contrôleurs

    Curieux de connaître l’impact pratique de la bande passante, nous avons réalisé une grande partie des benchs avec 1, 2 et 3 canaux actifs. Sans dire que les modes double et triple canal n’apportent rien, le moins que nous puissions dire est que les gains sont modestes. D’ailleurs lors des tests des Athlon 64 en Socket 939, force était déjà de constater que les gains apportés par le double contrôleur étaient très limités...


    Le troisième contrôleur est-il inutile ? Dans bon nombre de cas d’utilisation simple, probablement. D’ailleurs la déclinaison mainstream de Nehalem devrait se contenter de deux contrôleurs et présenter un excellent rapport prix/performances. Pour en revenir au troisième canal, il devrait s’illustrer lors de l’utilisation simultanée de nombreuses applications gourmandes en bande passante, quand la carte graphique accède à de la mémoire (ou, dans une configuration serveur, quand un autre processeur Core i7 accède à la mémoire au travers du bus QPI - voir illustration ci-dessous). Malheureusement, ces cas de figures ne sont pas très simples à mettre en œuvre et encore moins à « bencher ».



    Performances des caches

    Attention : Les échelles ne sont pas les mêmes pour les processeurs Core et Nehalem.


    Latence des caches du Core 2 Extreme QX9770


    Latence des caches du Core i7 Extreme 965

    Les mesures de latence des caches réalisées avec Right Memory Analyzer montrent que le cache L1 du Core i7 est de 4 cycles contre 3 cycles pour le Core 2 Quad. Au-delà des 32 Ko de cache L1, les latences montent respectivement à 7 et 9 cycles. Sorti des 256 Ko de cache de second niveau, le cache L3 des Core i7 affiche une latence de 9 cycles (comme les 6 Mo de cache L2 des Penryn). Une excellente performance pour un cache si conséquent mais aussi d’un niveau si « reculé ».

    Hors de tout cache, l’architecture Nelahem accède à la mémoire centrale en moins de 17 cycles alors qu’il en faut plus de 32 dans le cas de Core.



    Taux de transfert des caches du Core 2 Extreme QX9770


    Taux de transfert des caches du Core i7 Extreme 965

    Au niveau du taux de transfert des caches L1 et L2, ils progressent de l’ordre de 10%. A noter qu’avec les optimisations de Nehalem, l’écriture dans le cache L1 a été fortement augmentée (courbes verte et rouge). Dans le reste des caches et dans une moindre mesure de la mémoire, les taux de transfert en écriture sont en forte progression. Rappelez-vous cette citation dans la modification des ports du pipeline : Par rapport aux unités de traitement des Penryn, celles du Core i7 bénéficient d’optimisations au niveau des ports Load (port 3) et Store (port 4) qui supportent chacun une opération par cycle, ce qui n’était pas possible auparavant.


    Consommation

    Au repos, la configuration Nehalem équipée d’une modeste Radeon X1600 consomme 10% de plus que sa devancière (avec la même carte graphique). Il s’agit de la consommation de tout le système et non du processeur seul. En pleine charge avec Prime multi core, l’écart atteint 13% et monte jusqu’à presque 24% avec le mode Turbo. C’est à la fois peu et beaucoup. Dans l’absolu, la configuration Nehalem atteint une valeur élevée mais en mettant en parallèle les gains de performances (presque 60% dans Reference), Intel semble avoir atteint son objectif : une puissance par watt sans précédent…




    Températures et nuisances

    Everest est en mesure de lire les sondes de températures du Core i7. Equipé du Thermaright Extreme 120 LGA-1366 edition, le Core i7 Extreme 960 affiche une température de l’ordre de 32°C (de 31 à 35°C selon les cores) au repos. Après une vingtaine de minutes sous Prime, les températures se sont stabilisées aux alentours de 70°C (de 66 à 70°C). Malgré la charge maximale, le ventilateur de 120 mm n’a pas augmenté sa vitesse de rotation : 1400 rpm. Autant le dire clairement, il sera facile de faire une configuration Nehalem aussi puissante que silencieuse. Avec un TDP annoncé de l’ordre de 130 Watts, le radiateur box est dépassé et nous l’avons très vite retiré en raison du bruit de son ventilateur...



    Overclocking

    Avant de se lancer dans l’overclocking, il y a lieu de savoir comment sont distribuées les fréquences et comment les contrôler. Sur notre carte mère Intel DX58SO, tout est axé autour de la fréquence du bus QPI et il devrait en être de même pour n’importe quelle carte mère LGA-1366…

  • La fréquence finale du processeur – la partie Core – est obtenue ainsi (3200 MHz = 133 x 24) :
    Freq Core processeur = Freq QPI x Core Multiplicateur
  • La fréquence de la mémoire est obtenue par la formule suivante (1066 MHz = 133 x 8) :
    Freq mémoire = Freq QPI x Memory multiplicateur
    A noter que les multiplicateurs mémoire sont limités à 6, 8, 10 et 12, soit des fréquences pour la DDR3 de 800 MHz, 1066 MHz, 1333 MHz et 1600 MHz).

  • La fréquence de la partie Uncore du Core i7 est basée sur (2666 MHz = 133 x 20) :
    Freq Uncore processeur = Freq QPI x Uncore Multiplicateur
    Le multiplicateur Uncore doit être au moins le double du Multiplicateur mémoire (au moins 12 dans notre cas). Le BIOS de la DX58SO mère offre une plage de réglages allant de 12 (2 x 6, le multiplicateur nécessaire à la DDR3 à 800 MHz) à 30. Enfin, il ne faut pas oublier que pour une fréquence de 133 MHz, le bus QPI est capable d’offrir 4,8 GT/s, 5,866 GT/s et 6,4 GT/s (un peu comme le bus HyperTransport des Athlon). Au besoin, il faudra abaisser cette valeur transactions/transmission par seconde afin d’atteindre de plus hautes fréquences au niveau du processeur. Il faut également désactiver le mode Turbo avant de se lancer dans l’overclocking !!!


    Le Core i7 Extreme 965 en mode Turbo.


    Notez la fréquence de la partie Uncore : 2666 MHz.

    Toute augmentation de la fréquence du bus QPI aura un impact sur la fréquence des parties Core, Uncore et sur la mémoire. Il faudra donc à chaque fois s’assurer que ce n’est pas Core, Uncore ou la mémoire qui atteint son maximum. A noter que CPU-Z sera de bon secours en affichant la fréquence du processeur dans le premier onglet ainsi que celles de la mémoire et de la partie Uncore dans l’onglet memory.


    Impossible d'atteindre 4 GHz...

    Notre processeur de test a atteint une fréquence de 162,3 MHz pour le QPI soit un peu moins de 3900 MHz (+21% par rapport au mode normal et « seulement » +8,3% par rapport au mode Turbo). A 164 MHz, le chargement de Windows XP s’arrêtait systématiquement quels que soient les autres réglages… De belles prestations pour un processeur de pré série aussi complexe et déjà cadencé à une fréquence conséquente ! Le kit Intel Core i7 Extreme devant encore être testé par des confrères, nous n'avons pas poussé les tensions outre mesure...


    Conclusion

    Si ce premier test pratique ne met en lice que les deux fleurons des architectures Core et Nehalem, il permet de les comparer à fréquence rigoureusement égale (3200 MHz). La nouvelle architecture apporte des gains de performances qui peuvent atteindre presque 60% dans le meilleur des cas même si dans d’autres, les prestations – déjà excellentes – stagnent. La consommation en idle reste très contenue. Elle s’envole un peu en charge maximale mais les résultats sont à l’avenant et la performance par watt progresse immanquablement. En examinant les performances avec seulement deux barrettes de mémoire, le triple contrôleur mémoire semble un peu superflu… Il devrait cependant assurer d’excellentes performances même sous des charges très importantes. La technologie Turbo est une véritable aubaine pour tous ceux qui n’ont pas forcément envie de mettre la main dans le cambouis pour profiter d’un petit extra au niveau des performances. Tout est sous le contrôle du circuit « Power Control Unit » et totalement transparent ! Les Core i7 permettront aussi aux fans d’overclocking de s’en donner à cœur joie. Certes, il faudra appréhender quelques notions nouvelles au niveau des bus et multiplicateurs mais les gains atteints avec notre processeur de tests sont très prometteurs… A l’heure actuelle, nous ne pouvons nous pencher sur le rapport prix/performances qui ne serait pas intéressant avec un Core i7 Extreme 965 à plus de 1000 €. Nous recommanderons cette nouvelle architecture sans réserve… dès que les modèles plus abordables seront disponibles !
  •