Intel présente Lunar Lake (CPU, GPU, NPU), lance ses Xeon 6 E-core et Gaudi 3 pour l’IA
J’ai demandé à la Lune…
Après NVIDIA et AMD, c’était au tour d’Intel de présenter ses nouveautés lors du Computex. Il y était question de la nouvelle génération de CPU Lunar Lake, des processeurs Xeon 6 (E et P) pour les serveurs et de l’accélérateur Gaudi 3.
Le 04 juin 2024 à 14h21
8 min
Hardware
Hardware
Attaquons avec Lunar Lake, la prochaine gamme de processeurs pour les ordinateurs portables. Intel annonce de nouveaux cœurs P-core (pour les performances) et E-core (pour l’efficacité énergétique) : les Lion Cove et Skymont respectivement, gravés par… TSMC.
Avant d’entrer dans le détail, quelques grandes lignes. Le fabricant affirme que la consommation peut baisser « jusqu'à 40 % » par rapport à la génération précédente. D’autres fonctionnalités sont de la partie, notamment la décompression H.266 (VVC), un NPU pour l’IA à 48 TOPS et un iGPU plus performant. Adieu toutefois la possibilité d’augmenter la mémoire vive de sa machine.
- AMD : Zen 5 à tous les étages (Ryzen AI, 9000, Epyc), roadmap des GPU Instinct jusqu’en 2026
- NVIDIA : IA, IA, GPU Rubin, IA, IA, SFF-Ready, IA, IA…
Lion Cove (P-core) et Skymont en (E-core)
Selon AnandTech, qui détaille en profondeur la nouvelle architecture des cœurs Intel, les Lion Cove proposent une « refonte significative de la hiérarchie des caches des P-core traditionnels d'Intel ». Le cache est au cœur des optimisations également annoncées chez AMD et Arm.
D’autres ajustements sont aussi de la partie afin de mettre « l'accent sur l'amélioration des performances et de l'efficacité », toujours selon nos confrères. Le gain sur l’IPC (Instructions par cycle) pourrait atteindre 30 %, soit un bond important.
Les E-core Skymont ne sont pas en reste, avec là aussi des gains notables sur le papier. Comparé aux cœurs E-core LP (Low Power) de Meteor Lake (Crestmond), Skymont consomme un tiers de moins pour les mêmes performances.
Avec une consommation identique, les performances sont en hausse d’un facteur 1,7x en monothread et de 2,9 en multithread. Dans tous les cas, il faudra juger des résultats à l’aune des premiers tests.
Mémoire intégrée au CPU, des cœurs gravés chez TSMC
Dans sa présentation, Intel annonce Lunar Lake comme une configuration de type 4P + 4E. Il n’est pas question d’hyper-threading/SMT pour le moment (ce que confirme AnandTech dans son analyse), le nombre de threads est donc le même que celui des cœurs : huit.
Jusqu’à 32 Go de mémoire (LPDDR5X) sont pris en charge par le CPU. Intel a changé son fusil d’épaule concernant la mémoire, désormais intégrée sur le processeur, comme chez Apple, via un bus sur 2x64 bits (il y a deux puces, comme on peut le voir sur l’image ci-dessous). Inconvénient majeur : il n’est plus possible de modifier la quantité de mémoire vive sur sa machine.
Revenons sur un changement dans la stratégie d’Intel : les tuiles de ses E-core et P-core ne sont pas produites dans ses usines (c’était le cas sur la génération précédente, en Intel 4), mais chez son partenaire TSMC avec le procédé de gravure N3B. Le SoC en lui-même utilise le N6 de TSMC.
Ce n’est pas totalement une surprise puisqu’Intel s’appuyait déjà en partie sur TSMC pour produire ses CPU. Le fondeur avait déjà fait part de son intention d’ouvrir sa fonderie vers le monde, dans les deux sens. Elle propose en effet ses services à d’autres et fait également produire en dehors de ses usines.
Xe2 pour le GPU, avec décompression VVC (H.266)
Le GPU intégré se décompose en deux parties : les cœurs Xe2 (seconde génération de l’architecture Arc Xe) pour le graphisme et les matrices Xe Matrix Extension (XMX) pour l'IA. Les cœurs GPU sont jusqu’à 1,5x plus rapides que ceux de la génération précédente (Meteor Lake). Du côté des matrices XMX, Intel annonce jusqu’à 67 TOPS en INT8.
Côté sortie vidéo, l’Embedded DisplayPort 1.5 (eDP) est supporté, en plus des classiques Display Port 2.1 et HDMI 2.1
En plus de la prise en charge du codec AV1 (compression et décompression), le GPU de Lunar Lake propose de la décompression matérielle de VVC (aussi appelé H.266 ou Versatile Video Coding). Ce format a été présenté en 2020, après trois ans en partenariat avec Apple, Ericsson, Intel, Huawei, Qualcomm et Sony notamment.
Les promesses sont un peu toujours les mêmes en pareille situation : un bond d’environ 50 % dans la réduction du poids sans « différence perceptible dans la fidélité visuelle », ou une meilleure qualité à taille constante. Intel annonce de son côté une baisse de la taille d’un fichier de 10 % par rapport à AV1.
Le codec n’est pas libre de droit et sous licence FRAND (Fair, Reasonable And Non-Discriminatory). Rapidement, un consortium s’est monté autour du x266, une implémentation libre.
NPU 4 jusqu’à 48 TOPS pour l’IA (et Copilot+ ?)
Enfin, le CPU dispose d’un nouveau NPU (Neural Processing Unit) pour les calculs liés à l’intelligence artificielle, avec des performances « jusqu’à quatre fois plus rapides ». Intel annonce jusqu’à 48 TOPS pour son NPU 4, contre 11,5 TOPS pour la génération précédente.
Intel se place donc juste en dessous des Ryzen AI 300 avec un NPU à 50 TOPS. Le NPU 4 dépasse ainsi le minimum requis (40 TOPS selon AMD) pour qu’un portable puisse prétendre être estampillé Copilot+ par Microsoft. C’est également le cas chez NVIDIA, et on attend maintenant une réaction de Microsoft sur des portables estampillés Copilot+ sans puce Arm (Snapdragon X ou Elite).
Au total, Intel annonce donc jusqu’à 120 TOPS avec son processeur Lunar Lake. Il s’agit de l’addition du GPU (67 TOPS), du NPU (48 TOPS) et du CPU (5 TOPS).
Enfin, la connectivité n’est pas en reste avec du Thunderbolt 4 natif (avec Thunderbolt Share) et le Wi-Fi 7.
Les Xeon 6 E-core sont là, les P-core arrivent
Intel profite aussi du Computex pour revenir sur ses nouveaux Xeon 6, avec là encore des P-core et E-core : les séries 6700 et 6900. Il s’agit respectivement des Redwood Cove et Crestmont, que l’on retrouve dans la gamme Meteor Lake.
Les différents cœurs peuvent se retrouver dans les deux gammes ; Intel parle parfois de 6700E/6700P et 6900E/6900P pour marquer la différence.
Les premiers CPU disponibles dès maintenant sont les Xeon 6 avec des E-core 6700E (Sierra Forest). Les Xeon 6 avec des P-core 6900P (Granite Rapids), arriveront au prochain trimestre.
Il faudra attendre début 2025 pour que des Xeon 6700P et 6900E débarquent. Selon les configurations, le nombre de cœurs au maximum est le suivant : 86 pour les 6700P, 144 pour les 6700E, 128 pour les 6900P et 288 pour les 6900E.
Intel Gaudi 3 vs H100 de NVIDIA
Intel l’avait déjà présenté en avril, et profite du Computex pour revenir sur son accélérateur pour l’IA Gaudi 3. Fait relativement rare, la société met en avant le prix de sa solution et la compare à la concurrence :
« Un kit d'IA standard comprenant huit accélérateurs Intel Gaudi 2 avec une carte de base
universelle (UBB) proposé aux fournisseurs de systèmes au prix de 65 000 dollars est estimé à
un tiers du coût des plates-formes concurrentes comparables. Un kit comprenant huit
accélérateurs Intel Gaudi 3 avec une carte de base universelle sera proposé à 125 000 dollars,
soit environ deux tiers du coût des plateformes concurrentes comparables ».
Le constructeur se compare directement aux H100 de NVIDIA : « un cluster de 8 192 accélérateurs devrait offrir un temps d’entraînement jusqu'à 40 % plus rapide par rapport à un cluster de GPU NVIDIA H100 de taille équivalente et un débit en entraînement jusqu'à 15 % plus rapide pour un cluster de 64 accélérateurs par rapport à NVIDIA H100 sur le modèle Llama2-70B. En outre, Intel Gaudi 3 devrait offrir un inferencing en moyenne deux fois plus rapide que NVIDIA H100, en exécutant des LLM populaires tels que Llama-70B et Mistral-7B ».
Cette fois encore, Intel se présente comme la « seule alternative au NVIDIA H100 pour l'entraînement et l'inférence de grands modèles de langage (LLM) », laissant ainsi totalement de côté AMD et ses Instinct.
Intel présente Lunar Lake (CPU, GPU, NPU), lance ses Xeon 6 E-core et Gaudi 3 pour l’IA
-
Lion Cove (P-core) et Skymont en (E-core)
-
Mémoire intégrée au CPU, des cœurs gravés chez TSMC
-
Xe2 pour le GPU, avec décompression VVC (H.266)
-
NPU 4 jusqu’à 48 TOPS pour l’IA (et Copilot+ ?)
-
Les Xeon 6 E-core sont là, les P-core arrivent
-
Intel Gaudi 3 vs H100 de NVIDIA
Commentaires (3)
Modifié le 04/06/2024 à 14h42
Sinon, pas un mot sur les changements apportés à Thread Director alors qu'une slide est intégrée à l'article ?
ÉDIT : ah mais en fait, Lunar Lake, c'est uniquement pour les portables... donc le non-changement de RAM est moins étonnant, même si regrettable.
Le 04/06/2024 à 16h40
Pour aller plus loin, il faudrait faire un gros papier technique, ce n’était pas le but ici
Modifié le 04/06/2024 à 16h47
Pour le reste du papier, faudra voir les tests (comme en ce qui concerne nVidia et AMD). Et si tant la consommation que la chauffe baissent, ça sera très bien.