Home Tests Dossiers Ca ? C'est qu'un bench...

Ca ? C'est qu'un bench...

Imprimer Envoyer
Écrit par Pascal Thevenier   
Lundi, 28 Février 2005 01:46
Ah, ça ? C'est qu'un bench… Tant que mes jeux tournent, qu'est-ce que je peux bien avoir à faire du score 3D Mark 2003 ? Ces trucs là ne servent qu'à flatter l'ego de ceux qui ont des grosses configurations. Mon PC tourne bien ! L'exemple est peut-être un peu poussé mais il n'est pas loin de résumer bon nombre de sujets sur les forums. S'il est vrai qu'afficher de gros scores est toujours flatteur, par effet de mode, il semble de bon aloi de critiquer tout ce qui sert à mesurer les performances. Les prétextes sont divers : qu'il ne s'agit pas d'applications réelles, 3D Mark n'est pas un jeu… Il serait pourtant judicieux de ne pas s'arrêter à un jugement primaire de ces benchs qui peuvent être de très bons outils pour vérifier les performances de son PC. A condition de les utiliser en connaissance de cause…


Qu'avez-vous acheté ?

L'informatique est formidable, on peut faire des tas d'analogies avec des domaines bien connus comme l'automobile. L'ordinateur est un peu comme la voiture, on en a (presque) tous besoin. Mais aussi vrai que tout le monde ne roule pas dans la même voiture, tout le monde n'achète ou n'assemble pas son PC selon les mêmes critères. Certains achètent au moins cher, d'autres se lancent dans l'occasion alors qu'il en existent qui ne vivent que pour la performance pure. Heureusement, en informatique il n'y a pas de faux frais comme les assurances et le carburant… Mais restons-en à ce qui nous intéresse. Quand on achète une voiture ou un PC tout fait, il a généralement été conçu comme un ensemble (qu'il soit ou non un tout cohérent est un autre débat), mais qu'en est-il du PC fait maison ? Tous les éléments sensés fonctionner de concert le font-ils réellement et correctement ? Généralement, oui, mais pas toujours. Si on passe d'une antiquité à quelque chose de nouveau, on a bien sûr l'impression (et pas que l'impression) que "ça va bien". Oui, mais ça va bien par rapport à quoi ? Ca va bien comment ? Ou pire, ça ne va pas ! Ceux qui ne sont pas intéressés par la performance n'ont peut-être rien à faire du fait que leur matériel haut de gamme se "traîne" comme des composants moins chers, mais c'est quand même bien regrettable. Quel aurait donc été l'intérêt de chercher les meilleurs éléments pour au final n'exploiter qu'une partie de leur potentiel ? Sans mesures des performances, comment s'assurer d'en avoir pour son argent ? Avoir des écarts de quelques pourcents par rapport à une mesure de référence n'est en rien dramatique, mais si les valeurs sont inférieures de 10% voire plus avec les chiffres étalons, il y a quand même de quoi se poser des questions, non ?


Propagande pour de l'upgrade ?

Ce n'est certainement pas notre idée étant donné que nous allons surtout nous attacher à vérifier que tout fonctionne comme il se doit !!! Nous expliquerons également comment identifier des problèmes avec ce qui ne sera plus seulement des "benchs"… Enfin si vous vous demandez ce qui a motivé cet article, la réponse est simple : un jour quelqu'un a demandé dans notre forum si c'était normal que son Pentium 4 3.20C GHz fonctionne sur un bus à 400MHz parce qu'il ne voyait pas trop de différences avec son ancien PC. Forcément, un Pentium 4 à 1.6GHz, ça ne pousse pas comme un 3,2GHz… Nous profiterons également de ce dossier pour expliquer les programmes que nous utilisons dans nos tests et comparatifs. Pour illustrer le pire, nous avons monté un Athlon 64 3200+ sur une MSI K8N Neo2 avec 2 x 512Mo de DDR400 : vraiment n'importe comment…


Nos benchs processeurs…

Si vous lisez régulièrement nos articles, vous avez probablement remarqué que nous utilisons depuis un certains temps les mêmes programmes de mesure (parfois depuis fort longtemps). Il y a plusieurs raisons. Si nous prenons le cas de CPU Mark 99 ou de Super Pi, ces programmes sont vieux et datent respectivement de 1998 et 1995 ! Ils ne manquent pourtant pas d'intérêt : ils pèsent respectivement 513ko et 104ko et leur temps d'exécution est de maximum deux minutes sur un PC récent. Leur ancienneté fait qu'on peut facilement trouver des tests un peu partout et comparer avec du matériel plus ancien. A titre d'exemple, l'indice CPU Mark 99 d'un Pentium !!! 500MHz est de 37, celui d'un Athlon 64 3500+ de 260.

  • CPU Mark 99 mesure essentiellement le comportement d'un processeur sous Windows 98. Nous voilà bien avancés à présent que la majorité des PC fonctionne sous Windows XP. Bonne remarque, car CPU Mark 99 ne tient pas compte d'instructions comme SSE2. Cependant, l'indice est dépendant de l'architecture du processeur (Athlon/Pentium), de sa fréquence, de la bande passante mémoire, des timings mémoire et dans une moindre mesure du FSB. Les processeurs avec un pipeline court comme les Athlon XP, Athlon 64 et Pentium-m affichent de très bonnes performances à l'inverse des Pentium 4. Même si CPU Mark 99 est un vieux bench, les performances très moyennes affichées par le Pentium 4 se reflètent dans des jeux récents comme FarCry ou UT 2004. CPU Mark 99 est un test adapté pour mesurer des gains d'overclocking ou d'optimisation des timings mémoire.
    Topique spécifique : CPU Mark 99 [Mettez votre score...]

  • MetaBench est un test plus récent. Il fait intervenir de la compression/décompression audio (Ogg Vorbis audio encoding/decoding), gère les nouveaux jeux d'instructions (MMX, SSE, SSE2, 3DNow!), l'HyperThreading, utilise des algorithmes de Transformation de Fourier, triage de données et des scènes de Raytrace Rendering. Il s'agit d'une note plus globale que CPU Mark car elle mêle différents types d'activités du processeur. Les scores de MetaBench dépendent de l'architecture et des fréquences mais nettement moins d'optimisations diverses du BIOS. Par rapport au CPU Mark 99, MetaBench est mieux adapté à faire des comparaisons entre des systèmes fort différents comme un Athlon 64 et un Pentium 4.
    Topique spécifique : MBench faites peter les scores !

  • CineBench 2003 a le mérite de montrer quelque chose de bien concret. En effet, ce test réalise un rendu sur le moteur Cinema4D et l'indice est directement fonction du temps nécessaire à calculer l'image. Moins le processeur met de temps, plus le score est important. Comme quoi, un bench n'est finalement pas une mixture abjecte qui cherche à favoriser tel ou tel constructeur. Qui plus est, il s'agit ici d'un moteur de rendu bien réel et donc d'une mesure sur une application existante. Cinebench 2003 est capable d'exploiter l'HyperThreading des Pentium 4 de manière fort probante et illustre bien de quoi est capable ce processeur. Hélas, on retrouve rarement de tels gains en pratique… Comme MetaBench, CineBench 2003 dépend essentiellement de l'architecture et très peu des optimisations. Il est donc également bien adapté à des comparaisons.
    Topique spécifique : Cinebench 2003

  • Super Pi ne fait rien de plus compliqué que de donner le temps nécessaire à calculer les décimales de cette constante. C'est donc un test très concret. Il dépend essentiellement de la FPU et dans une mesure assez importante de la bande passante mémoire. A l'inverse de CPU Mark 99, Super Pi montre qu'un long pipeline n'est pas un désavantage dans les calculs répétitifs. Avec ce test, nous avons pu constater les performances catastrophiques de la FPU du VIA C3 et remarquer le fossé qui sépare VIA d'Intel et AMD au niveau de la conception d'une unité de calcul en virgule flottante. Super Pi est le programme qui sert à évaluer la FPU. Son score varie assez peu en fonction des optimisations des timings mémoire. Un bon outil de comparaison comme les deux tests précédents.
    Topique spécifique : Le topic de Super Pi 1M

  • Aquamark3 donne un score CPU assez intéressant car il exploite bien les possibilités des processeurs. Il est donc assez révélateur des performances avec un moteur de jeu réel. Il s'agit donc d'un score à "vocation plus ludique" assez représentatif dans les jeux récents comme DoomIII ou FarCry.
    Topique spécifique : Score CPU et GFX d'Aquamark 3


  • Gogo'n'Coda est un logiciel de compression MP3 parmi les plus rapides. Il est capable d'exploiter l'HyperThreading et les instructions multimédias jusqu'au SSE2. Encore une fois, le résultat est bien terre à terre : Gogo'n'Coda affiche la vitesse de compression : 10x signifie que 10 secondes sont encodées en MP3 chaque seconde. En d'autres mots, il faudra 10x moins de temps pour compresser des WAV en MP3 que pour les écouter. Gogo'n'Coda dépend principalement de l'architecture et de la fréquence. Un overclocking de 10% se retrouve peu ou prou dans la vitesse de compression. Les comparaisons peuvent être légèrement faussées en mesurant la vitesse de compression sur seulement une plage. L'idéal est de compresser le même album (ce que nous faisons dans nos tests).

  • Windows Media Encoder n'est pas un bench mais un programme de conversion de fichiers vidéos. Les scores que nous présentons sont les temps nécessaire à convertir un fichier MPG en WMV avec changement de résolution et allègement de la partie audio. Notre test ne peut pas vraiment être utilisé pour des comparaisons précises avec d'autres PC car le résultat dépend des paramètres de conversion sélectionnés et du fichier à convertir. Etant donné que nous faisons toujours appel au même fichier avec les mêmes préférences, nos scores sont représentatifs et comparables entre eux. La compression vidéo est – comme la compression audio – un des terrains de prédilection du Pentium 4.

    Peut-on attribuer une note ''magique et globale" à un processeur ou plus exactement à un ensemble processeur/chipset/mémoire ? La réponse est plutôt négative. Le Pentium 4 prend l'avantage sur l'Athlon en compression audio et vidéo. En contrepartie, il affiche des scores bien faibles dans les tests tels que CPU Mark 99 et Aquamark3 dont les scores sont respectivement assez représentatifs de la puissance processeur dans les jeux UT 2004 , FarCry et DoomIII. On peut par contre se baser sur des tests comme CineBench2003 et Super Pi qui sont très proches de la réalité ou encore sur Metabench dont la note globale semble bien pondérée pour des comparaisons assez diverses. Pour vérifier les prestations de sa propre configuration avec des références, CPU Mark 99, MetaBench, CineBench 2003, Super Pi et Aquamark3 score CPU sont globalement bien adaptés. Enfin, si nous n’utilisons pas de tests "développés en interne", c'est essentiellement pour permettre à nos lecteurs de télécharger ces programmes (ils sont gratuits ou existent au moins en version libre limitée) et comparer leurs scores avec ceux que nous publions.


    Le cas Sandra 2004 et la bande passante

    La bande passante mémoire mesurée par Sandra ou tout autre logiciel (Everest) est dans l'absolu assez peu intéressante sur le plan des performances globales. Un Athlon 64 en Socket 754 ne dispose pas du Dual Channel. Sa bande passante est de l'ordre de 2700 à 3000Mo/s, ce qui équivaut à la moitié de celle d'un Athlon 64 en Socket 939 (jusqu'à 6000Mo/s). Pourtant les Athlon 64 en Socket 754 sont loin d'être 50% moins performants que leurs cousins en Socket 939… En fait, seuls les Pentium 4 sont relativement tributaires de la bande passante mémoire pour leurs prestations globales. Se focaliser sur la bande passante pour qualifier les performances d'un système est aussi futile que se baser sur des MHz…


    Nos tests 3D...

    Pour tester les performances en 3D rien de tel que des jeux. Le seul problème vient de la comparaison des résultats. Avec la multiplication des options et options avancées, il est parfois assez difficile de décrire des réglages sans même compter que d'une configuration à l'autre, le jeu ajuste automatiquement certains paramètres. Une des solutions consiste à faire appel à un utilitaire comme Bench'Em All, FarCry Benchmark ou Half-Life² Benchmark qui se chargent de lancer les jeux avec des paramètres normalisés. Là encore, il y a lieu à polémique dans la mesure où tout le monde ne prend pas forcément soin de mettre ses jeux à jour avec les derniers patchs. Il peut donc résulter des écarts importants dans les scores ou pire, l'affichage sur une carte graphique ne sera pas comparable à celui d'une autre. C'est par exemple le cas des cartes GeForce FX 5900 XT qui ne sont utilisée que comme accélérateur DirectX 8.1 dans Half-Life² alors qu'il s'agit de circuits DirectX9… Enfin, dans le domaine de la 3D, on observe que tout le monde est loin d'avoir la même notion de jouabilité. Tout et n'importe quoi est alors mis en avant : 23 images par secondes suffisent ! Dommage mais un jeu n'est pas un film, il ne suffit pas de tromper l'œil avec une impression de fluidité. Dans un jeu, le nombre d'images par seconde fluctue en fonction de la complexité de la scène. Le nombre d'images par seconde moyen pour un jeu comme DoomIII ou UT 2004 doit être bien plus élevé que pour une course automobile ou une simulation aérienne. Dans un jeu de type First Person Shooter, de multiples explosions proches du joueur font baisser la cadence d'affichage de manière spectaculaire. Certains jeux comme UT2003 ont un bench très facilement accessible sans possibilités de configuration d'options, ce qui rend les résultats plus comparables. Hélas, UT2003 et même UT2004 sont presque plus dépendants du processeur que de la carte graphique… Dans ces conditions, difficile d'isoler la part de la carte 3D.


    Peut-on donner le même crédit à ce rendu minimaliste qu'à celui en qualité maximale ?
    Non, on ne peut pas non plus comparer la vitesse avec des qualités si déifférentes !

    Des benchs plus spécifiques comme les 3D Mark et autres Aquamark ont alors vu le jour. Ces tests permettent de contourner beaucoup de contraintes liées à la comparaison de scores issus de jeux. A condition de les utiliser à bon escient, ce qui implique de connaître leurs avantages et inconvénients. Parmi leurs avantages, ils sont gratuits ! Ensuite, contrairement à un jeu où il faudrait spécifier que le test doit être fait en telle résolution avec telles et telles options activées, ces tests se réalisent dans un mode par défaut autorisant une comparaison plus directe des scores. A ce niveau, Aquamark3 est très intéressant car il rapporte un score CPU, un score graphique et la moyenne des FPS (le score principal). 3D Mark a souvent été critiqué parce que son indice ne représente rien : 5000 points, c'est quoi ? Il suffit simplement de lire le fichier d'aide pour savoir comment est calculé le score ! Et ce score est bien basé sur le nombre d'images par seconde obtenu dans les différentes scènes… Au chapitre des critiques, le succès de ces tests synthétiques a conduit ATI, NVIDIA et XGI à produire des pilotes uniquement optimisés pour ces tests. Une pratique bien regrettable qui a un bon moment rendu la comparaison entre les Radeon 9800 et GeForceFX 5900 totalement caduque. Pour ce qui nous intéresse, l'intérêt demeure. En effet, il s'agit de s'assurer que son PC ne traîne pas la patte face à une configuration comparable. En d'autres mots, nous voyons ici le test pour vérifier qu'une Radeon 9800 Pro a bien les performances attendues, pas pour savoir si elle est plus rapide qu'une GeForce FX 5900 XT… Si les scores sont anormalement faibles, il s'agit peut-être d'une version 128bits ou d'un problème de pilote. Un score inférieur à la moyenne dans un bench (comme 3D Mark 2003) se reflètera immanquablement dans un jeu. 3D Mark 2003/2005 restent donc des tests bien pratiques pour s'assurer que les performances sont bien dans la moyenne…


    Un petit exemple…

    Pour illustrer l'intérêt de mesurer un minimum les prestations de sa machine, nous avons monté une configuration comme des ''manches''. Sur notre K8N Neo2 Platinum, nous avons installé (dans les slots bleus) des modules un peu anciens de DDR400 reconnus en DDR333 (avec l'option Auto du BIOS). Pour bénéficier du Dual Channel, il faut placer les modules dans les banques voisines, l'erreur que nous avons volontairement commise se produit régulièrement (il suffit de lire quelques forums pour s'en rendre compte). Nous avons également laissé toutes les options du BIOS en automatique et/ou par défaut.


    Comme le montre notre tableau, l'Athlon 64 3200+ monté correctement affiche des scores de 3% à 169% plus élevés que le système mal monté/configuré. Outre ces deux extrêmes (3D Mark 2003 dépend essentiellement de la carte graphique et la bande passante est directement proportionnelle à son mode de fonctionnement), on remarque une différence non négligeable dans un jeu comme DoomIII avec 12.5% alors que d'autres tests varient bien moins (CPU Mark ou Metabench). En fait, ce brillant Athlon 64 3200+ Socket 939 se comporte moins bien qu'un simple Athlon 64 3000+ Socket 754. En gros, l'argent investi dans la carte mère et l'Athlon Socket 939 est ''perdu''. Au tarif actuel, la MSI K8N Neo2 et l'Athlon 64 3200+ en 939 vous ont coûté ~330€ et vous avez droit aux performances d'une configuration à base de MSI K8N et d'Athlon 64 3000+ en 754 pour un total de ~240€.

  • Vérifier le bon fonctionnement
    Peu de tests ont été nécessaires pour mettre en évidence un problème de performances. Il reste maintenant à le résoudre avec les bons outils ! Visiblement, le taux de transfert mémoire est largement en dessous des attentes : 63% trop faible. L'utilisation de CPU-Z permet de se rendre compte que la mémoire ne fonctionne qu'à 166MHz et que le mode double canal n'est pas actif. Après avoir placé la mémoire dans la bonne banque et corrigé la fréquence dans le BIOS, les performances reviennent à la normale.
    Enfin, on remarque que le problème de performances (qui n'est pas à proprement parlé lié à la carte graphique), ne se reflète qu'à raison de 3% dans le 3D Mark 2003 alors que la différence atteint 11% dans DoomIII. Des jeux peuvent donc être plus pénalisés par de mauvais réglages que des benchs…
    Une mesure avec 3D Mark 2003 ou 2005 permet de s'assurer qu'une carte graphique donne les performances prévues en 3D. Avec les cartes bas de gamme, ce score peut mettre en évidence la présence d'un bus mémoire réduit (cas des Radeon 9800 Pro 128bits par exemple). Il ne faut pas se braquer à quelques points près… Une chose est certaine, si les performances sont inférieures de plus de 10% à une configuration comparable, quelque chose ne tourne pas rond : pilote de la carte graphique, du chipset, options graphiques mal réglées (AA et/ou AF activés puis oubliés), etc.

  • Optimiser
    L'envie de faire mieux nous a conduits à quelques essais d'optimisation (timings mémoire agressifs) et le PC semble bien fonctionner. Hélas, certains jeux se plantent de temps à autre. Pourtant, le système apparaît stable sous Windows XP... Une terminaison anormale de Super Pi provient généralement d'un problème de mémoire ou d'une surchauffe du processeur en cas d'overclocking. Prime95 permet de trouver le coupable grâce à différents modes de tests qui stressent plus le processeur ou la mémoire. MemTest86 peut lui aussi venir au secours d'une configuration bancale par une analyse poussée de la mémoire. Bien entendu, d'autres tests doivent être utilisés pour vérifier les gains apportés par les optimisations. Dans notre cas, les timings trop agressifs que nous avions imposés par le BIOS engendraient une légère instabilité.

  • Overclocker...
    Overclocker, pourquoi pas ! Mais est-il plus judicieux d'atteindre la fréquence la plus élevée possible quitte à utiliser de très mauvais timings mémoire ? Il est parfois plus judicieux de se contenter d'un overclocking plus faible mais en conservant la synchronisation entre le bus mémoire et le FSB ainsi que de bons timings. Une fois encore, les benchs pourront vous aider à déterminer la meilleure configuration.
    L'activation des pipelines des Radeon X800 Pro et des GeForce 6800/6800 LE est une opération facile. Pour s'assurer que l'opération est un succès, quelques tests avec des benchs (3D MArk 2003/2005) permettent de mesurer le gain de performances. Un gain bien plus complexe à quantifier avec un jeu...


    Conclusion

    Après l'assemblage ou l'achat d'une nouvelle configuration, quelques mesures de performances ne sont pas un luxe pour s'assurer que le matériel donne bien les prestations attendues. Dans cette optique, l'utilisation de benchs est bien plus judicieuse que la vérification de la vitesse des jeux au feeling. En effet, les benchs sont conçus pour donner des résultats facilement comparables. En outre, ils permettent de réaliser des mesures plus spécifiques (bande passante mémoire par exemple) pour identifier un problème éventuel. De plus, certains tests comme Super Pi mettent rapidement et simplement en évidence un problème de mémoire. Un score anormalement bas (par rapport à une configuration comparable) dans un test 3D Mark traduit généralement un problème : pilote graphique dépassé, oubli du pilote du chipset, AA et/ou AF activés et ''oubliés'', "conflit/mélange" de versions des pilotes etc.
    Si certains ne portent aucun intérêt aux performances de leur machine, d'autres visent le sommet tels LesFurieux.net... Sans céder à aucun excès, nous recommandons de réaliser au minimum les tests suivants : CPU Mark 99, 3D Mark 2003 et un test de bande passante et de les comparer à ceux de configurations semblables. CPU-Z permet de s'assurer du mode de fonctionnement de la mémoire : fréquence, timing et dual channel (s'il est d'application). Attention, le virus du bench peut frapper !
  • Mise à jour le Mardi, 10 Novembre 2009 20:23
     
    Note des utilisateurs: / 19
    MauvaisTrès bien