Intel : roadmap sur la finesse de gravure et les CPU, Xeon avec 288 cœurs, prototype UCIe, Gaudi3…

Intel sait aussi bien compter que Microsoft

Le 22 septembre 2023 à 14h49

9 min

Hardware

Le 14 décembre, Intel lancera ses processeurs Meteor Lake (avec NPU pour l’IA) et ses Xeon de 5e génération (Emerald Rapids). En attendant, le fondeur revient sur sa roadmap des deux prochaines années, aussi bien sur la partie CPU (Core, Xeon) que puces dédiées pour l’intelligence artificielle. Intel annonce aussi un prototype d’UCIe avec des chiplets Intel et Synopsys.

Cette semaine, Intel organisait sa troisième édition de ses Innovation Days. À cette occasion, le fondeur a emboité le pas à bons nombres des géants du Net en annonçant « une série de technologies visant à généraliser l’intelligence artificielle et à la rendre plus accessible dans tous les flux de travail, du client à la périphérie en passant par le réseau et le cloud ».

Pat Gelsinger, CEO d’Intel, explique que l’IA contribue à ce qu’il présente comme de la « Siliconomie » : une « économie de croissance, rendue possible par la magie du silicium et du logiciel ». En clair, on va en avoir un peu partout… y compris dans les processeurs Meteor Lake qui intégreront une puce d'accélération de réseaux de neurones (Neural Processing Unit, NPU) – nous y reviendrons – comme c’est le cas dans les SoC de Qualcomm depuis longtemps par exemple.

Intel 7, 4, 3…

Le patron de l’entreprise en profite pour revenir sur la fabrication actuelle des puces et leur finesse de gravure : « Intel 7 déjà en fabrication en volume, Intel 4 prêt à la fabrication et Intel 3 en bonne voie pour la fin de cette année ». Cela fait maintenant deux ans que la finesse de gravure a changé de nom chez le fondeur, qui a laissé tomber les « nm » (nanomètres).

Il s’agit pour Intel de mieux se positionner face à la concurrence sans paraitre en retard sur la finesse de gravure, notamment face à TSMC et Samsung. Intel 7 – qui affiche des gains de 10 à 15 % en performances/watt par rapport à son 10 nm SuperFin – se placerait ainsi en face des processus 7 ou 5 nm de TSMC. Intel 4/3 ferait ainsi face aux 3 nm (oui, il existe plusieurs types de lithographies en 3 nm) de TSMC, etc.

Intel 20A, 18A…

Cette conférence était aussi l’occasion de présenter « un wafer Intel 20A contenant les premières puces de test pour les processeurs Arrow Lake ». Ces Core de 15e génération devraient arriver en 2024. Dans 20A on retrouve un « A » comme Angström, une unité de mesure qui vaut 0,1 nanomètre. Intel 20A aurait ainsi presque pu s’appeler « Intel 2 », mais le passage à l’angström laisse plus de marge de manœuvre au fondeur pour la suite, notamment avec Intel A18, etc.

Comme cela a déjà été annoncé, les puces Intel 20A seront les premières « à inclure PowerVia, la technologie de fourniture d’énergie par l’arrière d’Intel, et la nouvelle conception de transistors "gate-all-around" appelée RibbonFET ». La suite, avec Intel 18A (PowerVia et RibbonFET) – nom de code Lunar Lake – « reste en bonne voie pour être prêt pour la fabrication au cours du second semestre 2024 ». Viendra ensuite Panther Lake dont ne sait rien à part le nom et qu’il devrait arriver en 2025.

Intel Core Ultra : Meteor Lake avec NPU arrive

Pour le grand public, Meteor Lake (gravé avec le procédé Intel 4) arrivera aussi le 14 décembre avec des CPU Intel Core Ultra, qui inaugureront donc la nouvelle nomenclature. La partie CPU comprendra des cœurs P (Redwood Cove) et E (Crestmont), mais pour la liste des modèles et la répartition, il faudra attendre le lancement.

Particularité de cette famille : les processeurs sont « dotés de la première unité de traitement neuronal intégrée d’Intel, ou NPU, pour une accélération de l’IA économe en énergie et une inférence locale sur le PC ». À la manière de ce que proposent les fabricants de SoC pour smartphones depuis longtemps, jusqu’à quatre tuiles différentes pourront être intégrées au sein d’une même puce : CPU, GPU, SoC et I/O.

Du Wi-Fi 7 est aussi au programme. Le décodage vidéo AV1 est pris en charge de manière matérielle (en plus des classiques MPEG, VP9, HEVC…), mais pas l’encodage.

Intel met aussi en avant les performances de la partie graphique intégrée Arc – avec jusqu’à 8 cœurs Xe-LPG (128 vector engines, 1 024 shaders, 8 ray tracing units…) – qui offrirait « un niveau de performances de type dédié » dans ces processeurs Meteor Lake. À vérifier bien évidemment.

Lors de la session de questions/réponses, Pat Gelsinger a confirmé qu’Intel travaillait sur une technologie similaire du 3D V-Cache d’AMD, mais qu’elle ne sera pas disponible sur génération Meteor Lake.

3D V-Cache : AMD dévoile sa solution pour des performances CPU encore meilleures dans les jeux

Un prototype Universal Chiplet Interconnect Express

Intel présente aussi son premier boitier de test Universal Chiplet Interconnect Express (UCIe), nom de code Pike Creek. Il est issu d’un consortium annoncé au début de l’année dernière, dans le but d’établir « une norme d'interconnexion die-to-die et de favoriser un écosystème de puces ouvertes ». Selon Intel, « la norme UCIe permettra aux chiplets de différents fournisseurs de fonctionner ensemble, ce qui permettra de nouvelles conceptions pour l’expansion de diverses charges de travail d’IA ».

Ce prototype combine « un chiplet Intel UCIe IP fabriqué sur Intel 3 et un chiplet Synopsys UCIe IP fabriqué sur le procédé de TSMC N3E. Les chiplets sont connectés à l’aide de la technologie d’emballage avancée EMIB (embedded multi-die interconnect bridge) ». Au-delà de la combinaison de deux chiplets différents, cette puce permet surtout de mettre en avant « l’engagement de TSMC, Synopsys et Intel Foundry Services » dans le standard ouvert UCIe.

Cent vingt entreprises sont partenaires pour le moment. Reste à voir si d’autres sociétés se lanceront dans l’aventure en développant des puces avec des chiplets de partenaires. Pour le moment, Intel est le premier (et le seul) fabricant à présenter un prototype fonctionnel.

IA : Gaudi2 dans un supercalculateur, Gaudi3 arrive

Sur l’IA, Intel met en avant son accélérateur Gaudi2 « comme la seule alternative viable sur le marché ». L’entreprise précise un peu sa pensée : « Sur la base des résultats de MLPerf Training 3.0 publiés en juin 2023, Gaudi2 est la SEULE alternative viable au H100 pour la formation de grands modèles de langage comme GPT-3 ». Quid des nouvelles Instinct d’AMD ?

Prochainement, un supercalculateur pour l’IA « sera entièrement construit sur des processeurs Intel Xeon et 4 000 accélérateurs matériels Intel Gaudi2 AI, avec Stability AI comme client de référence », affirme Intel, mais sans donner plus de détails pour l’instant.

En coulisse, Gaudi3 se prépare, avec des performances multipliées par quatre sur les Bfloat16, 50% de plus de HBM et 50% de plus aussi de bande passante sur la partie réseau. La puce Gaudi3 sera gravée en 5 nm.

Les nombres en informatique : entiers, virgule flottante, simple et double précision (FP32/64), Tensor Float (TF32)…

Viendra ensuite Falcon Shores, avec CPU (x86) et GPU (Xe) au sein d'un même socket, avec un accès mémoire unifié. L’ensemble a déjà été annoncé comme 5x plus rapide, dense et efficace. Là encore, on repassera pour les détails.

Roadmap des Xeon : Sierra Forester, Granite Rapids, Clearwater Forest

Sur les processeurs et plus particulièrement les Xeon de 5e génération (Emerald Rapids, qui succède aux Sapphire Rapids), Intel annonce « une combinaison d’améliorations de performance et de mémoire plus rapide, avec la même consommation énergétique ». Le lancement d’Emerald Rapids est prévu pour le 14 décembre, en même temps que les processeurs Meteor Lake.

Ce sera ensuite au tour de Sierra Forest – « avec l’efficacité des cœurs E-core » – de débarquer au premier semestre 2024. Intel promet « une densité de rack 2,5 fois supérieure et des performances par watt 2,4 fois supérieures à celles des Xeon de 4e génération ».

288 cœurs (et autant de Threads) dans Sierra Forest

« Il existera aussi une version avec 288 cœurs » (une puce, deux dies) qui arrivera en 2024, précise Intel afin de se relancer dans la course au nombre de cœurs.

Attention, il s’agit de 288 cœurs et autant de threads. Pour rappel, la société parle de Performance-cores pour les P-cores et d’Efficient-cores pour les E-cores. Dans le cas de Sierra Forest, il s’agit bien des E-Core, pas les cœurs les plus puissants donc.

Une manière de répondre aux processeurs de la série 9004 d’AMD (EPYC 9754, 9754S et 9734) avec respectivement 128C/256T, 128C/128T et 112C/224T. Attention, les CPU d’AMD n’exploitent pas l’architecture Zen 4, mais des cœurs « allégés » Zen 4c (Bergamo) afin d’arriver à une telle densité. 288C/288T chez Intel, 128C/256T chez AMD, la guerre est ouverte.

Après, Intel passera sur Granite Rapids, avec des cœurs P-core cette fois-ci et des « performances IA 2 à 3 fois supérieures à celles des Xeon de 4e génération ». On change ensuite d’année pour passer en 2025 avec « le Xeon E-core de nouvelle génération, dont le nom de code est Clearwater Forest, arrivera sur le nœud de fabrication Intel 18 A ».

Commentaires (16)

Albirew Abonné

Le 22/09/2023 à 15h08

c’est fou comme les générations de xeons me font penser à des stages dans sonic…

DantonQ-Robespierre Abonné

Le 22/09/2023 à 15h39

PowerVia, la technologie de fourniture d’énergie par l’arrière

Heu… gasp… ahem… comment leur dire ?…

Intel devient proctologue ?

pamputt Abonné

Le 22/09/2023 à 18h44

C’est bien joli ces finesses de gravure de plus en plus petite mais sachant d’un atome de silicium ça fait environ 11 anstrom, j’ai du mal à voir comment on fabrique un transistor avec un ou deux atomes. Quelqu’un pourrait m’expliquer à quoi correspond des chiffres comme 3 nm, voir 2 ou 1,8 nm ?

floh Abonné

Le 22/09/2023 à 22h46

Je vais imagé car ce n’est pas exactement ça :
Avant ces chiffres représentaient la finesse de gravure des transistors et des pistes.
Maintenant les transistors se font plus verticaux (il faut de plus en plus de couches) et on diminue l’espacement entre les transistors ou entre les pistes, voir on diminue un peu la taille de la piste. De fait, on gagne effectivement en surface et en échauffement. Mais les vrais gains sont moins important qu’avant.
Les tensions des puces ont fortement diminuées car une largeur de piste faible fait qu’on peut faire passer moins de puissance avant que la piste ne grille. Ce qui pose problème pour la montée en fréquence (la différence de tension entre un 0 et un 1 diminue).

Peut-être que quelqu’un d’autre pourra me corriger ou donner plus de précisions.

barlav Abonné

Le 23/09/2023 à 10h43

Ca fait longtemps que l’industrie microélec est passée d’une appellation du plus petit élément processable à une évaluation de densité au um².

Tu peux graver une gate en 3nm; si derrière tu satures sur la métallisation des couches basses, tu ne vas pas pouvoir profiter de cet élément à 3nm.
Donc il y a plein d’évolutions sur l’ensemble du process pour exploiter au mieux la gate en 3nm.

Intel a fait plusieurs étapes sur le 10 pour améliorer un usage efficient.

Dans ces technos on est sur 10 à 20 couches de métallisation :
la moitié est avec des métaux très résistifs, pour des courtes distances, et avec des procédés en dual - tri - quad patterning, voir EUV. ça demande plusieurs masques pour faire 1 couche.
l’autre moitié est à l’ancienne, avec des métaux larges et qui peuvent véhiculer des signaux rapides ou de la puissance.

Enfin, pour avoir des performances correctes, la plupart des éléments ne se servent pas de cette taille minimale : pour une clock ou des bus critiques tu mets des centaines de mos en // pour chaque signal, seul les modes éco bénéficient de cette gravure plus fine.

Cqoicebordel Abonné

Le 23/09/2023 à 07h32

Et ces finesses de gravures ne mesurent plus rien de concret. Mais en plus, avant (enfin, pendant un temps après la période où ça représentait les transistors), ça représentait la distance entre certains éléments constituants un transistor.

Bref, ça permet juste de se donner un ordre d’idée (passer de 7 à 3, plus de 50% de réduction, passer de 20A à 18A, réduction de 10%)

DantonQ-Robespierre Abonné

Le 22/09/2023 à 21h46

(reply:2154434:pamputt) La réponse est dans l’article :

Angström, une unité de mesure qui vaut 0,1 nanomètre

11 Angströms vaudraient dooonc…?

pamputt Abonné

Le 23/09/2023 à 07h11

(quote:2154439antonQ-Robespierre)
11 Angströms vaudraient dooonc…?

Je me suis trompé (j’ai oublié un 0), c’est pas 11 angstrom mais 110 angstrom soit 11 nm.

eophea Abonné

Le 23/09/2023 à 07h25

C’est 110 picomètres, soit 1,1 angströms ou 0,11 nanomètres.

pamputt Abonné

Le 23/09/2023 à 10h30

eophea a dit:

C’est 110 picomètres, soit 1,1 angströms ou 0,11 nanomètres.

Oui tu as raison, décidément, je n’étais pas bien réveillé.

Wosgien Abonné

Le 23/09/2023 à 13h31

Ça fait un peu catalogue de ‘on peut tout faire, mais qu’est ce qui sera concret là-dedans? Intel me donne l’impression d’être le champion de la bonne idée pas aboutie/menée à terme…
Plein d’intentions…

Hugues1337

Le 23/09/2023 à 15h22

Cette roadmap fait tellement du bien si on se remémore l’ancien CEO.

croustx

Le 23/09/2023 à 19h40

Quid des roadmap FPGA chez Intel ?

Hugues1337

Le 23/09/2023 à 20h21

Tu veux un Mister Pro ?

croustx

Le 24/09/2023 à 12h15

Hugues1337 a dit:

Tu veux un Mister Pro ?

jeff.110 Abonné

Le 24/09/2023 à 20h25

C’est assez inhabituel de voir Linux associé à la promo d’un nouveau processeur !