
Les Pentium 4 ont inauguré l'architecture Netburst ce qui n'avait pas déclenché un enthousiasme flagrant sur la scène hardware, et pour cause : les performances étaient bien en deçà de ce que pouvaient laisser espérer les fréquences de fonctionnement. Deux raisons à cela : premièrement, Intel n'avait pas jugé bon de développer une plateforme DDR pour son Pentium 4, et celui-ci devait jongler entre les plateformes SDRAM certes peu coûteuses, mais aux performances à la traîne, et les plateformes Rambus inabordables financièrement mais qui convenait à la grande demande en bande passante de ces processeurs. La deuxième raison, liée directement à l'architecture Netburst, est que cette architecture a été développée dans le but de monter en fréquence et que le nombre de niveaux de pipeline a été prévu en conséquence. En effet, avec 20 niveaux, la profondeur de pipeline a doublé par rapport à l'architecture P6. L'impact positif est que cela freine moins la montée en fréquence, mais le problème est que l'impact de toute remise à zéro d'un pipeline (en cas d'erreur de prédiction par exemple) est extrêmement pénalisante pour les performances, a fortiori quand la fréquence de fonctionnement du processeur n'est pas très élevée.
Question unité de calcul, cette architecture dispose comme de l'architecture P6 de deux ALU et une FPU. Le cache L1 se limite pour sa part à 8 Ko. Autre particularité du Pentium 4, son bus de type Quad Pumped capable d'envoyer quatre mots de 64 bits par cycle d'horloge (contre deux pour un Athlon XP par exemple). Notons enfin l'ajout des instructions SSE2. Le constat performance s'est très nettement amélioré avec les évolutions des core. Le core Willamette a été la première déclinaison. Gravé en 0.18 microns, il a connu un changement de socket (du 423 au 478 pins).
Le core Northwood
L'arrivée du core Northwood a correspondu avec celle de la finesse de gravure en 0.13 microns. Ce core a ensuite connu trois déclinaisons de FSB : FSB 400 (100 MHz Quad Pumped) notés A, 533 (133*4) notés B et 800 (200*4) notés C. Ces derniers sont notamment la preuve de la bonne tenue en fréquence des Pentium 4, puisque la version la plus performante testée dans cet article est cadencée à 3.4 GHz, soit un GHz de plus que chez le concurrent AMD. Notons pour finir que le core Northwood a également fait l'objet de l'intégration de la technologie Hyperthreading permettant de disposer virtuellement de deux processeurs au lieu d'un. C'est du moins la façon dont Intel le vend alors qu'en fait le Pentium 4 HT peut simplement exécuter deux threads simultanément, c'est-à-dire pendant le même cycle. Cette fonction qui est difficile à mesurer apporte par contre un confort d'utilisation indéniable.
Le core Prescott
Le Prescott se présente comme une évolution de l'architecture Netburst. Gravé en 0.09 microns, il dispose de plus du double de transistors par rapport à son prédécesseur le Northwood, en partie en raison d'une quantité de mémoire cache revue à la hausse. On retrouve donc un cache de premier et de second niveau tous deux doublés (respectivement 16 Ko au lieu de 8 et 1024 Ko au lieu de 512), ce qui permet théoriquement d'augmenter les performances, en particulier pour l'Hyperthreading. Celui-ci a également été revu par Intel afin de l'optimiser. A ceci s'ajoute l'implémentation d'instructions SSE3 qui complètent les instructions SSE et SSE2 déjà existantes. Il faut néanmoins attendre que des programmes soient développés pour tirer parti de ces instructions supplémentaires. Si tout ceci est de bonne augure en ce qui concerne les performances même du processeur, celui-ci a néanmoins un handicap de taille face au Northwood : la profondeur de ses pipelines. On retrouve ainsi sur le Prescott un pipeline de 31 étages contre 20 pour son prédécesseur. Bien évidemment, Intel a effectué ce changement sciemment, le but avoué étant de pouvoir plus aisément monter en fréquence. Malheureusement pour le Prescott, cette augmentation de profondeur lui coûte cher puisque à fréquences égales par rapport au Northwood une erreur dans une prédiction de résultat lui sera beaucoup plus préjudiciable en termes de performances. Pour compenser cela, Intel a néanmoins fait en sorte d'améliorer la prédiction de branchement afin de limiter les dégâts. Malgré tout, il semble qu'actuellement l'adversaire le plus coriace du Prescott reste bel et bien le Northwood, du moins pour ce qui est du socket 478.