Home Tests Hardware Test de l'Intel Pentium 4 Prescott 90nm

Test de l'Intel Pentium 4 Prescott 90nm

Imprimer Envoyer
Note des utilisateurs: / 7
MauvaisTrès bien 
Écrit par Pascal Thevenier   
Lundi, 02 Février 2004 09:39
En 2001, Intel doit remplacer le Pentium !!! qui ne supporte plus la montée en fréquence. Le constructeur introduit donc une nouvelle architecture largement optimisée pour les hautes fréquences. Les premiers Pentium 4 appelés Willamette sont gravés en 180nm et ne disposent que de 256Ko de cache L2. Le nouveau venu est loin de faire l'unanimité ! Le Pentium 4 évolue ensuite vers un nouveau Socket 478 qui servira également de support à la seconde génération baptisée Northwood. Grâce au 130nm, le Pentium 4 embarque plus de cache et les performances grimpent. Au cours de sa longue carrière (de 1.6GHz à 3.4GHz) le Northwood connaît de nombreuses améliorations : augmentation du FSB de 100 à 133MHz, l'HyperThreading et une nouvelle augmentation du FSB de 133 à 200MHz. Il est à présent temps de passer à la suite...


Willamette & Northwood

Pour préparer le terrain du Pentium 4 qui devait aller de paire avec la mémoire Rambus, Intel avait déjà introduit ce nouveau type de mémoire sur les derniers Pentium !!!. Sans grand succès ! En effet, ces derniers étaient à bout de souffle et leurs performances n'étaient pas spécialement tributaires de la bande passante… Quand le Pentium 4 Willamette arrive sur le marché en avril 2001, le terrain n'est pas des plus propices. La Rambus est très coûteuse à cause d'une faible demande et les Athlon ont largement la cote grâce à un rapport prix performances imbattable.
Le Pentium 4 est un processeur conçu pour donner le meilleur de lui-même dans les hautes fréquences à condition qu'il ait un très large accès à la mémoire. Les premiers exemplaires sont décevants comme le rappelle notre test du Pentium 4 Willamette 1.4GHz… Intel fera cependant rapidement grimper la fréquence jusqu'à 2GHz, un cap fatidique : le Socket 423 ne peut supporter une plus haute fréquence !
Moins d'un après la sortie du Pentium 4, le constructeur bascule vers le Socket 478 en essuyant une pluie de critiques sous le couvert de la sacro-sainte évolutivité. Le Willamette n'a jamais séduit. Trop de gens connaissaient les limite du Socket 423, le FSB 100MHz QDR et les 256Ko de cache L2 sont bien trop petits pour servir de tampon valable avec une coûteuse mémoire Rambus…
Début 2002, le Pentium 4 évolue avec la révision Northwood qui dispose d'un cache L2 de 512Ko grâce à la nouvelle finesse de gravure. Au niveau du support, le Socket 478 est bien mieux adapté. Les pins supplémentaires garantissent un meilleur signal et une alimentation optimale. Débutant sa carrière à 1.6GHz avec un FSB de 100MHz QDR, le Northwood atteint 2.6GHz.
Parallèlement aux processeurs, les chipsets évoluent également. A partir de décembre 2001, Intel n'est plus lié à Rambus et peut enfin emboîter le pas vers la mémoire DDR. Le Northwood est déjà bien plus séduisant et surtout, il devient beaucoup plus abordable et performant.
Mi-2002, le Northwood connaît une petite évolution avec l'introduction d'un FSB de 133MHz QDR. Les Pentium 4 ''B'' sont conçus pour opérer avec les chipsets i845PE et offrir une meilleure bande passante au processeur grâce au support de la DDR 333. Les Northwood à FSB 133MHz existent à de nombreuses fréquences : 2.80GHz, 2.66GHz, 2.53GHz, 2.40B GHz et 2.26 GHz.
En novembre 2002, le Northwood connaît encore une évolution. Intel lui apporte la technologie HyperThreading avec le Pentium 4 3.06GHz HT. Ce processeur est un peu le seul de sa catégorie. Il exploite un FSB de 133MHz QDR et ne dispose que de l'i845PE trop limité avec son seul support de la DDR 333 pour alimenter ''deux'' Pentium 4…
En avril 2003, Intel frappe fort en annonçant toute une lignée de Pentium 4 HyperThreading (3.20GHz, 3GHz, 2.80C GHz, 2.60C GHz, 2.40C GHz) exploitant un FSB de 200MHz QDR grâce à une nouvelle gamme de chipsets (i865 et i875) supportant la DDR 400 en double canal. Deux ans après le premier Willamette, les Northwood ''C'' bénéficient de la bande passante mémoire titanesque qui leur a trop souvent fait défaut et présentent une belle souplesse en multi-tâches via l'HyperThreading.


Le Prescott 90nm

Le Prescott ou Pentium 4 ''E'' quand il existe une déjà une version de même fréquence est gravé en 90nm contre 130nm pour le Northwood. Une gravure plus fine est intéressante à plus d'un titre. Au niveau économique, après l'amortissement des nouvelles usines, un processeur en 90nm revient moins cher à produire. L'adoption du 90nm sur des galettes de 300mm permet de placer trois fois plus de die Prescott que de die Northwood en 130nm avec les waffers de 200mm. Le cœur du Prescott ne mesure d'ailleurs que 112mm² contre 121mm² pour le Northwood. D'un point de vue électrique, le 90nm permet d'abaisser la tension d'alimentation du processeur qui est à présent comprise entre 1.25v et 1.4v contre 1.5v pour les Northwood. Notre exemplaire de test utilisait pour sa part 1.325v. En termes de fonctionnalités, le 90nm permet de placer plus de transistors sur moins de mm². Les 125 millions de transistors du Prescott permettent d'embarquer un cache L2 de 1024ko contre 512ko en 130nm. Intel en a profité pour doubler le cache L1 qui évolue de 8 à 16ko. Enfin, le dernier apport du 90nm est une dissipation thermique qui à défaut d'être réellement moindre s'avère contenue (le cache L2 intervient de manière importante dans la chaleur dégagée).
Intel n'est pas seulement passé du 130nm au 90nm. Le masque utilisé dans la lithographie évolue de 248nm à 193nm. Le fondeur utilise à présent un ''Strained Silicon lattice'' autorisant un déplacement bien plus rapide des électrons. Le Prescott se compose de 7 couches avec des interconnexions en cuivre (6 pour le Northwood). Le nouveau Pentium 4 fait appel à un diélectrique Low k CDO au lieu du Low k SIOF. Et pour terminer, le ''Nickel Solicide'' remplace le ''Cobalt Solicide''. Pas très évocateur n'est-ce pas ? Il est intéressant par contre de savoir que la taille d'une cellule de mémoire (comme celle du cache) passe de 2µm² à 1.15µm², ce qui permet de se rendre compte de la miniaturisation qui découle de l'ensemble.


La logique du Prescott

Un processeur est composé de différentes entités d'un pipeline d'exécution. Il peut d'ailleurs être comparé à une ligne de montage à la chaîne. Plus la ligne comporte de postes, plus ces postes réalisent une tâche élémentaire. Une tâche élémentaire demandant bien moins de temps qu'une tâche complexe, la chaîne peut avancer très vite… Les Pentium 4 reposent tous sur ce principe qui est l'essence même de l'architecture NetBurst. Tous les Pentium 4 ont un pipeline de 20 étages alors que les Pentium !!! et Athlon XP en utilisent de 10 à 15. L'allongement du pipeline ne pose pas de problème de performances tant que la chaîne va bien. En cas d'erreur, il faut tout vider et repartir. L'opération est coûteuse en cycles processeur… Par contre, si tout va bien, que l'unité de prédiction de branchement ne fait pas d'erreur, les 2 unités ALU simples permettent une vitesse de traitement exemplaire (cas des boucles conditionnelles dans un compteur).
Avec le Prescott, Intel a encore allongé le pipeline qui passe de 20 à 31 étages ! En se basant sur la ''catastrophe'' découlant du passage de 10 à 20 étages entre le Pentium !!! et le Pentium 4, le pire était à craindre ! En pratique, Intel semble bien maîtriser la situation. L'unité de préfetch qui sert à remplir le pipeline (correctement) a encore été optimisée tout comme l'unité de prédiction de branchement. Le but est bien entendu de faire le moins d'erreurs possible et ne quasiment jamais avoir besoin de vider le pipeline. Si le trace cache reste limité à 12 000µops, le cache L1 atteint à présent 16ko. De nouveaux WC buffers font également leur apparition et le Trace Cache BTB passe de 512 entrées à 2000 entrées. La gestion de l'HyperThreading a également été améliorée notamment avec 2 des 13 instructions SSE3 (en l'occurrence MONITOR et MWAIT). Selon Intel, cet arsenal technologique doit permettre au Prescott d'être aussi performant que le Northwood malgré l'allongement du pipeline…


Prescott & SSE3

Il y a longtemps qu'Intel ne nous avait pas sorti un nouveau jeu d'instructions. Le Prescott introduit le SSE3 qui se compose de 13 nouvelles fonctions. Elles portent sur la conversion FP en Integer (FISTTP), l'encodage vidéo (LDDQU), le traitement de complexes (MOVSUBPD, ADDSUBPS, MOVDDUP, MOVSHDUP et MOVSLDUP), le traitement des matrices (ADDPD, HSUBPD, HADDPS et HSUBPS) et enfin les threads (MONITOR et MWAIT). Pour bénéficier des avantages du SSE3, il faudra attendre une optimisation du code… Certaines instructions notamment sur les matrices sont le résultat de la demande de développeurs.


Chaud mon Prescott, chaud !

Pour éviter que le système de refroidissement casse les oreilles, Intel a introduit un système qui consiste à asservir la vitesse du ventilateur à la quantité de chaleur à évacuer. Le HSF doit être conçu pour permettre le maintien de la température en dessous de la valeur Tmax pour un TDP défini. En pratique, un Pentium 4 Prescott 3.2GHz doit être refroidi par un HSF dont le TDP (Thermal Design Power) est de 103Watts. Le Tmax est une valeur propre à chaque Prescott. Tant que le processeur est en-dessous de cette température, le ventilateur tourne moins vite. Rien de neuf en comparaison avec ce que font déjà nos cartes mères ? Non, si ce n'est que chaque Prescott a sa propre valeur de Tmax calibrée et encodée…
En pratique, le Prescott 2.8E GHz est jusqu'à 10°C plus chaud qu'un Northwood 2.8GHz.


En pratique…

Le Pentium 4 Prescott de test nous a été livré avec une carte mère Intel D875PBZ à base d'i875P. Il n'y a donc rien de neuf actuellement du côté des chipsets. Nous avons directement testé le processeur sur deux autres cartes mères afin de nous assurer de son bon fonctionnement. L'Abit IC7-G et l'Asus P4C800 supportent toutes les deux le Precott après mise à jour du BIOS. Sans cette mise à jour, le BIOS 1.006 de la P4C800 nous gratifiait d'un message alarmant : CPU Fail !
Même après une utilisation intensive, nous n'avons pas observé de chauffe du VRM. Il faut rappeler que les 103Watts annoncés dans la documentation d'Intel représentent la puissance requise pour le système de refroidissement et non la puissance du processeur. En effet, comment les Prescott 3.2GHz et 3.4GHz dissiperaient-ils la même puissance !?
Le HSF livré dans le kit de test est une vieille connaissance. Il s'agit du radiateur dont le cœur (cylindrique) est en cuivre. Son ventilateur est assez puissant (12v sous .44A soit 5.28Watts) contre seulement 2.52watts (.21A) pour la génération précédente. Le niveau sonore s'en ressent si la carte mère ne dispose pas d'une technologie ''Q-Fan''… La carte mère d'Intel est livrée avec Intel Active Monitor qui permet de surveiller les températures en temps réel.



Configuration de tests

Nous avons underclocké le Prescott 3.2GHz à 2.8GHz pour le comparer à un Northwood de même fréquence. A titre indicatif, nous avons également testé le Prescott à 3.2GHz pour l'opposer à un Athlon XP 3200+ installé sur une Asus A7N8X Deluxe.

Matériel et drivers
  • Abit IC7-G et Asus A7N8X Deluxe Rev 2.0
  • Prescott 3.2GHz (et 2.8GHz), Northwood 2.8GHz et AMD Athlon XP 3200+
  • 2 x 512Mo Corsair TWINX 3200LL
  • Maxtor DiamondMax Plus 9 120Go ATA133
  • Ecran IIyama Vison Master 403 (synchronisation verticale désactivée)
  • ATI Radeon 9700

    Logiciel
  • Windows XP SP1 français + DirectX 9.0b
  • ATI Catalyst 4.10
  • CPU Mark 99, Dual CPU Mark 99
  • Test LAB2003
  • Super Pi
  • Gogo n Coda
  • Cinebench 2003
  • CPU Bench 2003
  • Unreal Tournament 2003 (1024x768x32)
  • 3D Mark 2003 v340 (1024x768x32)
  • 3D Mark 2001 SE 330
  • ZD Content Creation 2003


    Performances

    Ce premier test nous a fait peur ! Le Prescott 2.8GHz se montre 12.7% moins rapide que le Northwood de même fréquence. Le Prescott 3.2GHz atteint seulement 188 soit le score du Northwood 2.8GHz… Les Athlon XP étant brillants dans ce test, ils s'attribuent les premières places.

    Test LAB 2002 dépend beaucoup de la fréquence. Du coup, à 2.8GHz, le Prescott et le Northwood se tiennent à 2% (en faveur du Northwood).

    Super Pi calcule les décimales de la constante Pi. Nous avons demandé 1M décimales… Dans ce test, le Prescott est 4% plus rapide que le Northwood. On notera que le Barton 2800+ et le Northwood 2.8GHz mettent le même temps.

    L'encodage MP3 en VBR est exprimé en ratio Encode/Play. Un indice de 10 signifie que le processeur encode à 10x la vitesse de lecture. Dans ce test, le Prescott est très décevant. Le Northwood se montre presque 14% plus rapide. Il semblerait que le bit rate variable conduise à de fréquentes erreurs qui conduisent à vider le pipeline. La compression en bit rate constant se solde par un écart beaucoup plus réduit (~4%).

    Cinebench 2003 réalise le calcul d'une image 3D et exploite le mode bi-processeurs. Les Pentium 4 ont donc une note single CPU et CPU avec HyperThreading. Ici encore le Northwood est plus rapide. Mais le Prescott se console avec un gain de 19% avec HyperThreading contre 18% pour le Northwood. A noter que l'HyperThreading permet aux Pentium 4 de s'illustrer face aux Athlon XP.

    En lançant deux CPU Mark 99 en même temps, il est possible d'illustrer les gains de l'HyperThreading. Alors que les Pentium 4 ont deux scores identiques (un score par processeur), les Athlon ont un score principal et un score secondaire beaucoup plus faible. Le Prescott est une fois de plus en retrait…

    CPU Mark 2003 semble avoir un bug… Mais un bug intéressant qui illustre que dans certains cas, le Prescott pourrait être réellement très performant comme le fait remarquer cet excellent article de Onversity… Nous ne retiendrons cependant pas ce test comme valide pour une comparaison.

    Le test processeur du 3D Mark 2003 montre un très faible écart entre le Prescott et le Northwood.
    A l'issue des tests reposant en quasi totalité sur le processeur, le Prescott se montre généralement plus lent que le Northwood. Les différents artifices utilisés par Intel pour combler l'allongement du pipeline s'en sortent bien pour compenser les 11 nouveaux étages. Nous somme loin de la bérézina Pentium !!! – Pentium 4, mais il n'y a pas de miracles pour autant…

    Dans les tests généraux comme le Content Creation 2003, la diversité des tâches nivelle l'écart comme en atteste le petit dixième de point d'écart… Notons au passage que les Athlon XP commencent à fatiguer.

    Quelques tests 3D pour en finir ! Les Athlon XP brillent sous UT 2003 et le Northwood devance le Prescott comme à l'accoutumée… Dans les deux 3D Mark, même constatation si ce n'est que les Athlon XP sont en retrait.

    Certes, Intel a bien géré les nouveaux étages du pipeline, mais le bilan global des performances se solde par une victoire du vieux Northwood face au nouveau Prescott.


    Le cas du cache

    Les caches du Prescott sont deux fois plus grands que ceux du Northwood. Comme le montre le graphe, les débits sont comparables avec une baisse importante dès que la capacité du cache (L1 ou L2) est dépassée. Le cache du Northwood (bleu) se montre plus rapide que celui du Prescott (rouge). Le Prescott est essentiellement plus lent lors de l'écriture ou de déplacements dans le cache. Il conserve l'avantage en lecture.

  • Northwood :
    L1 cache (8KB) speed (MB/s): Read=20577.1, Write=9178.2
    L2 cache (512KB) speed (MB/s): Read=10878.6, Write=9138.9

  • Prescott :
    L1 cache (16KB) speed (MB/s): Read=20752.8, Write=7615.9
    L2 cache (1024KB) speed (MB/s): Read=11116.5, Write=7680.7

  • Northwood :
    steps: 4 8 16 32 64 128 256 512 1k 2k 4k (bytes)
    Block of 1KB: 1 1 1 1 1 1 1 1 - - - cycles
    Block of 2KB: 1 1 1 1 1 1 1 1 1 - - cycles
    Block of 4KB: 1 1 1 1 1 1 1 1 1 1 - cycles
    Block of 8KB: 1 2 2 3 2 2 1 1 1 1 1 cycles
    Block of 16KB: 2 3 9 18 19 19 19 23 19 20 2 cycles
    Block of 32KB: 2 3 9 18 19 19 19 19 19 19 20 cycles
    Block of 64KB: 2 2 4 10 17 17 17 19 21 21 28 cycles
    Block of 128KB: 2 2 4 10 17 17 17 20 22 21 24 cycles
    Block of 256KB: 2 3 5 11 18 18 19 22 26 24 25 cycles
    Block of 512KB: 6 3 15 12 20 22 22 40 31 42 53 cycles
    Block of 1024KB: 10 7 13 25 49 166 173 175 191 209 234 cycles
    Block of 2048KB: 10 8 14 27 56 192 197 203 209 217 224 cycles
    Block of 4096KB: 9 8 15 27 55 212 212 217 219 232 230 cycles
    Block of 8192KB: 9 7 14 25 49 2440 170 176 190 210 239 cycles
    Block of 16384KB: 10 7 13 25 49 190 197 203 210 220 230 cycles
    Block of 32768KB: 10 7 14 25 49 190 202 202 206 221 229 cycles


  • Prescott :
    steps: 4 8 16 32 64 128 256 512 1k 2k 4k (bytes)
    Block of 1KB: 4 4 4 5 4 4 4 4 - - - cycles
    Block of 2KB: 4 4 4 4 6 4 4 4 4 - - cycles
    Block of 4KB: 4 4 4 4 4 5 4 4 4 4 - cycles
    Block of 8KB: 4 4 4 4 4 4 6 4 4 4 4 cycles
    Block of 16KB: 4 4 4 5 5 4 4 4 4 4 4 cycles
    Block of 32KB: 5 7 10 17 27 27 27 29 27 27 4 cycles
    Block of 64KB: 5 7 11 17 28 29 29 29 28 28 27 cycles
    Block of 128KB: 5 7 11 19 28 27 28 29 28 27 29 cycles
    Block of 256KB: 5 7 11 16 27 30 30 30 34 31 34 cycles
    Block of 512KB: 5 7 11 16 27 28 30 32 37 46 64 cycles
    Block of 1024KB: 6 9 13 22 31 51 34 34 39 48 64 cycles
    Block of 2048KB: 8 9 13 25 48 127 273 287 293 307 311 cycles
    Block of 4096KB: 8 9 13 26 48 127 276 286 293 309 315 cycles
    Block of 8192KB: 8 9 13 23 42 118 321 326 273 279 328 cycles
    Block of 16384KB: 8 9 30 23 42 120 320 325 310 307 316 cycles
    Block of 32768KB: 8 9 13 23 41 110 277 287 295 308 317 cycles

    Si les taux de transfert restent au final très proches, il n'en va pas de même pour les temps d'accès. Les accès au cache L1 demandent généralement 4 cycles contre généralement 1 seul pour le Northwood. Avec le cache L2, le tableau est comparable. Il faut jusqu'à 29 cycles au Prescott pour accéder au cache L2 contre seulement 19 au Northwood. Il s'agit d'un choix délibéré d'Intel afin de pouvoir monter en fréquence, de telles latences ne sont pas liées à la taille du cache. Le Pentium-m qui affiche déjà 1Mo de cache (et même le Dothan avec 2Mo de cache) affichent des latences respectives de 3 et 10 cycles pour les cache L1 et L2.

    Il semble assez étrange que le Prescott n'affiche pas des performances bien pire sachant que d'une part le pipeline est beaucoup plus long (même avec une excellente prédiction de branchement) et que les caches sont si lents. Le déplacement de certaines instructions de l'ALU complexe vers l'ALU rapide (2x) peut expliquer en partie les bonnes performances mais… Il y a de quoi se demander comment fait le Prescott !


    Overlocking

    Notre Prescott ne s'est pas montré à la hauteur de nos espérances. Nous avons atteint seulement 3500MHz. Mais notre Pentium 3 ES refusait de prendre un multiplicateur de 16 avec les paramètres de configuration personnalisés du Soft Menu III. Nous nous sommes alors rabattus sur le 14x avec un FSB maximum de 250MHz. Au delà, et malgré l'emploi d'un Corsair HydroCool 200, pas moyen d'aller plus haut de manière stable.


    Conclusion

    Les nouveautés introduites par Intel ne parviennent au final pas réellement à combler l'allongement du pipeline et le Prescott s'incline devant le Northwood. En fait, le Prescott ne profite pas réellement à l'utilisateur final mais à Intel. Avec sa nouvelle technologie 90nm, le fondeur produira ses processeurs à moindre coût…
    Au final, on pourra se consoler avec la baisse des prix annoncée et des tarifs Prescott – Northwood identiques. Il est également probable que les prochains steppings du Prescott seront plus coopératifs en overclocking…

    Intel Prescott
    Pour :
    Rien de spécial, SSE3 ?
    Contre : Performances inférieures à celles du Northwood
  • Mise à jour le Mardi, 10 Novembre 2009 20:23