Intel : roadmap sur la finesse de gravure et les CPU, Xeon avec 288 cœurs, prototype UCIe, Gaudi3…
Intel sait aussi bien compter que Microsoft
Le 22 septembre 2023 à 14h49
9 min
Hardware
Hardware
Le 14 décembre, Intel lancera ses processeurs Meteor Lake (avec NPU pour l’IA) et ses Xeon de 5e génération (Emerald Rapids). En attendant, le fondeur revient sur sa roadmap des deux prochaines années, aussi bien sur la partie CPU (Core, Xeon) que puces dédiées pour l’intelligence artificielle. Intel annonce aussi un prototype d’UCIe avec des chiplets Intel et Synopsys.
Cette semaine, Intel organisait sa troisième édition de ses Innovation Days. À cette occasion, le fondeur a emboité le pas à bons nombres des géants du Net en annonçant « une série de technologies visant à généraliser l’intelligence artificielle et à la rendre plus accessible dans tous les flux de travail, du client à la périphérie en passant par le réseau et le cloud ».
Pat Gelsinger, CEO d’Intel, explique que l’IA contribue à ce qu’il présente comme de la « Siliconomie » : une « économie de croissance, rendue possible par la magie du silicium et du logiciel ». En clair, on va en avoir un peu partout… y compris dans les processeurs Meteor Lake qui intégreront une puce d'accélération de réseaux de neurones (Neural Processing Unit, NPU) – nous y reviendrons – comme c’est le cas dans les SoC de Qualcomm depuis longtemps par exemple.
Intel 7, 4, 3…
Le patron de l’entreprise en profite pour revenir sur la fabrication actuelle des puces et leur finesse de gravure : « Intel 7 déjà en fabrication en volume, Intel 4 prêt à la fabrication et Intel 3 en bonne voie pour la fin de cette année ». Cela fait maintenant deux ans que la finesse de gravure a changé de nom chez le fondeur, qui a laissé tomber les « nm » (nanomètres).
Il s’agit pour Intel de mieux se positionner face à la concurrence sans paraitre en retard sur la finesse de gravure, notamment face à TSMC et Samsung. Intel 7 – qui affiche des gains de 10 à 15 % en performances/watt par rapport à son 10 nm SuperFin – se placerait ainsi en face des processus 7 ou 5 nm de TSMC. Intel 4/3 ferait ainsi face aux 3 nm (oui, il existe plusieurs types de lithographies en 3 nm) de TSMC, etc.
Intel 20A, 18A…
Cette conférence était aussi l’occasion de présenter « un wafer Intel 20A contenant les premières puces de test pour les processeurs Arrow Lake ». Ces Core de 15e génération devraient arriver en 2024. Dans 20A on retrouve un « A » comme Angström, une unité de mesure qui vaut 0,1 nanomètre. Intel 20A aurait ainsi presque pu s’appeler « Intel 2 », mais le passage à l’angström laisse plus de marge de manœuvre au fondeur pour la suite, notamment avec Intel A18, etc.
Comme cela a déjà été annoncé, les puces Intel 20A seront les premières « à inclure PowerVia, la technologie de fourniture d’énergie par l’arrière d’Intel, et la nouvelle conception de transistors "gate-all-around" appelée RibbonFET ». La suite, avec Intel 18A (PowerVia et RibbonFET) – nom de code Lunar Lake – « reste en bonne voie pour être prêt pour la fabrication au cours du second semestre 2024 ». Viendra ensuite Panther Lake dont ne sait rien à part le nom et qu’il devrait arriver en 2025.
Intel Core Ultra : Meteor Lake avec NPU arrive
Pour le grand public, Meteor Lake (gravé avec le procédé Intel 4) arrivera aussi le 14 décembre avec des CPU Intel Core Ultra, qui inaugureront donc la nouvelle nomenclature. La partie CPU comprendra des cœurs P (Redwood Cove) et E (Crestmont), mais pour la liste des modèles et la répartition, il faudra attendre le lancement.
Particularité de cette famille : les processeurs sont « dotés de la première unité de traitement neuronal intégrée d’Intel, ou NPU, pour une accélération de l’IA économe en énergie et une inférence locale sur le PC ». À la manière de ce que proposent les fabricants de SoC pour smartphones depuis longtemps, jusqu’à quatre tuiles différentes pourront être intégrées au sein d’une même puce : CPU, GPU, SoC et I/O.
Du Wi-Fi 7 est aussi au programme. Le décodage vidéo AV1 est pris en charge de manière matérielle (en plus des classiques MPEG, VP9, HEVC…), mais pas l’encodage.
Intel met aussi en avant les performances de la partie graphique intégrée Arc – avec jusqu’à 8 cœurs Xe-LPG (128 vector engines, 1 024 shaders, 8 ray tracing units…) – qui offrirait « un niveau de performances de type dédié » dans ces processeurs Meteor Lake. À vérifier bien évidemment.
Lors de la session de questions/réponses, Pat Gelsinger a confirmé qu’Intel travaillait sur une technologie similaire du 3D V-Cache d’AMD, mais qu’elle ne sera pas disponible sur génération Meteor Lake.
Un prototype Universal Chiplet Interconnect Express
Intel présente aussi son premier boitier de test Universal Chiplet Interconnect Express (UCIe), nom de code Pike Creek. Il est issu d’un consortium annoncé au début de l’année dernière, dans le but d’établir « une norme d'interconnexion die-to-die et de favoriser un écosystème de puces ouvertes ». Selon Intel, « la norme UCIe permettra aux chiplets de différents fournisseurs de fonctionner ensemble, ce qui permettra de nouvelles conceptions pour l’expansion de diverses charges de travail d’IA ».
Ce prototype combine « un chiplet Intel UCIe IP fabriqué sur Intel 3 et un chiplet Synopsys UCIe IP fabriqué sur le procédé de TSMC N3E. Les chiplets sont connectés à l’aide de la technologie d’emballage avancée EMIB (embedded multi-die interconnect bridge) ». Au-delà de la combinaison de deux chiplets différents, cette puce permet surtout de mettre en avant « l’engagement de TSMC, Synopsys et Intel Foundry Services » dans le standard ouvert UCIe.
Cent vingt entreprises sont partenaires pour le moment. Reste à voir si d’autres sociétés se lanceront dans l’aventure en développant des puces avec des chiplets de partenaires. Pour le moment, Intel est le premier (et le seul) fabricant à présenter un prototype fonctionnel.
IA : Gaudi2 dans un supercalculateur, Gaudi3 arrive
Sur l’IA, Intel met en avant son accélérateur Gaudi2 « comme la seule alternative viable sur le marché ». L’entreprise précise un peu sa pensée : « Sur la base des résultats de MLPerf Training 3.0 publiés en juin 2023, Gaudi2 est la SEULE alternative viable au H100 pour la formation de grands modèles de langage comme GPT-3 ». Quid des nouvelles Instinct d’AMD ?
- NVIDIA dévoile son H100 (Hopper) : Transformer Engine, DPX, HBM3, PCIe 5.0, 60 TFLOPS
- Pluie d’annonces chez AMD : Ryzen PRO 7000, EPYC 4e génération avec 128C/256T ou 3D V-Cache, Instinct MI300X
Prochainement, un supercalculateur pour l’IA « sera entièrement construit sur des processeurs Intel Xeon et 4 000 accélérateurs matériels Intel Gaudi2 AI, avec Stability AI comme client de référence », affirme Intel, mais sans donner plus de détails pour l’instant.
En coulisse, Gaudi3 se prépare, avec des performances multipliées par quatre sur les Bfloat16, 50% de plus de HBM et 50% de plus aussi de bande passante sur la partie réseau. La puce Gaudi3 sera gravée en 5 nm.
Viendra ensuite Falcon Shores, avec CPU (x86) et GPU (Xe) au sein d'un même socket, avec un accès mémoire unifié. L’ensemble a déjà été annoncé comme 5x plus rapide, dense et efficace. Là encore, on repassera pour les détails.
Roadmap des Xeon : Sierra Forester, Granite Rapids, Clearwater Forest
Sur les processeurs et plus particulièrement les Xeon de 5e génération (Emerald Rapids, qui succède aux Sapphire Rapids), Intel annonce « une combinaison d’améliorations de performance et de mémoire plus rapide, avec la même consommation énergétique ». Le lancement d’Emerald Rapids est prévu pour le 14 décembre, en même temps que les processeurs Meteor Lake.
Ce sera ensuite au tour de Sierra Forest – « avec l’efficacité des cœurs E-core » – de débarquer au premier semestre 2024. Intel promet « une densité de rack 2,5 fois supérieure et des performances par watt 2,4 fois supérieures à celles des Xeon de 4e génération ».
288 cœurs (et autant de Threads) dans Sierra Forest
« Il existera aussi une version avec 288 cœurs » (une puce, deux dies) qui arrivera en 2024, précise Intel afin de se relancer dans la course au nombre de cœurs.
Attention, il s’agit de 288 cœurs et autant de threads. Pour rappel, la société parle de Performance-cores pour les P-cores et d’Efficient-cores pour les E-cores. Dans le cas de Sierra Forest, il s’agit bien des E-Core, pas les cœurs les plus puissants donc.
Une manière de répondre aux processeurs de la série 9004 d’AMD (EPYC 9754, 9754S et 9734) avec respectivement 128C/256T, 128C/128T et 112C/224T. Attention, les CPU d’AMD n’exploitent pas l’architecture Zen 4, mais des cœurs « allégés » Zen 4c (Bergamo) afin d’arriver à une telle densité. 288C/288T chez Intel, 128C/256T chez AMD, la guerre est ouverte.
Après, Intel passera sur Granite Rapids, avec des cœurs P-core cette fois-ci et des « performances IA 2 à 3 fois supérieures à celles des Xeon de 4e génération ». On change ensuite d’année pour passer en 2025 avec « le Xeon E-core de nouvelle génération, dont le nom de code est Clearwater Forest, arrivera sur le nœud de fabrication Intel 18 A ».
Intel : roadmap sur la finesse de gravure et les CPU, Xeon avec 288 cœurs, prototype UCIe, Gaudi3…
-
Intel 7, 4, 3…
-
Intel 20A, 18A…
-
Intel Core Ultra : Meteor Lake avec NPU arrive
-
Un prototype Universal Chiplet Interconnect Express
-
IA : Gaudi2 dans un supercalculateur, Gaudi3 arrive
-
Roadmap des Xeon : Sierra Forester, Granite Rapids, Clearwater Forest
-
288 cœurs (et autant de Threads) dans Sierra Forest
Commentaires (16)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 22/09/2023 à 15h08
c’est fou comme les générations de xeons me font penser à des stages dans sonic…
Le 22/09/2023 à 15h39
Intel devient proctologue ?
Le 22/09/2023 à 18h44
C’est bien joli ces finesses de gravure de plus en plus petite mais sachant d’un atome de silicium ça fait environ 11 anstrom, j’ai du mal à voir comment on fabrique un transistor avec un ou deux atomes. Quelqu’un pourrait m’expliquer à quoi correspond des chiffres comme 3 nm, voir 2 ou 1,8 nm ?
Le 22/09/2023 à 22h46
Je vais imagé car ce n’est pas exactement ça :
Avant ces chiffres représentaient la finesse de gravure des transistors et des pistes.
Maintenant les transistors se font plus verticaux (il faut de plus en plus de couches) et on diminue l’espacement entre les transistors ou entre les pistes, voir on diminue un peu la taille de la piste. De fait, on gagne effectivement en surface et en échauffement. Mais les vrais gains sont moins important qu’avant.
Les tensions des puces ont fortement diminuées car une largeur de piste faible fait qu’on peut faire passer moins de puissance avant que la piste ne grille. Ce qui pose problème pour la montée en fréquence (la différence de tension entre un 0 et un 1 diminue).
Peut-être que quelqu’un d’autre pourra me corriger ou donner plus de précisions.
Le 23/09/2023 à 10h43
Ca fait longtemps que l’industrie microélec est passée d’une appellation du plus petit élément processable à une évaluation de densité au um².
Tu peux graver une gate en 3nm; si derrière tu satures sur la métallisation des couches basses, tu ne vas pas pouvoir profiter de cet élément à 3nm.
Donc il y a plein d’évolutions sur l’ensemble du process pour exploiter au mieux la gate en 3nm.
Intel a fait plusieurs étapes sur le 10 pour améliorer un usage efficient.
Dans ces technos on est sur 10 à 20 couches de métallisation :
la moitié est avec des métaux très résistifs, pour des courtes distances, et avec des procédés en dual - tri - quad patterning, voir EUV. ça demande plusieurs masques pour faire 1 couche.
l’autre moitié est à l’ancienne, avec des métaux larges et qui peuvent véhiculer des signaux rapides ou de la puissance.
Le 23/09/2023 à 07h32
Et ces finesses de gravures ne mesurent plus rien de concret. Mais en plus, avant (enfin, pendant un temps après la période où ça représentait les transistors), ça représentait la distance entre certains éléments constituants un transistor.
Bref, ça permet juste de se donner un ordre d’idée (passer de 7 à 3, plus de 50% de réduction, passer de 20A à 18A, réduction de 10%)
Le 22/09/2023 à 21h46
11 Angströms vaudraient dooonc…?
Le 23/09/2023 à 07h11
Je me suis trompé (j’ai oublié un 0), c’est pas 11 angstrom mais 110 angstrom soit 11 nm.
Le 23/09/2023 à 07h25
C’est 110 picomètres, soit 1,1 angströms ou 0,11 nanomètres.
Le 23/09/2023 à 10h30
Oui tu as raison, décidément, je n’étais pas bien réveillé.
Le 23/09/2023 à 13h31
Ça fait un peu catalogue de ‘on peut tout faire, mais qu’est ce qui sera concret là-dedans? Intel me donne l’impression d’être le champion de la bonne idée pas aboutie/menée à terme…
Plein d’intentions…
Le 23/09/2023 à 15h22
Cette roadmap fait tellement du bien si on se remémore l’ancien CEO.
Le 23/09/2023 à 19h40
Quid des roadmap FPGA chez Intel ?
Le 23/09/2023 à 20h21
Tu veux un Mister Pro ?
Le 24/09/2023 à 12h15
?
Le 24/09/2023 à 20h25
C’est assez inhabituel de voir Linux associé à la promo d’un nouveau processeur !