NVIDIA : IA, IA, GPU Rubin, IA, IA, SFF-Ready, IA, IA…

Huang et Macron sont-ils une seule et même personne ?

La conférence de NVIDIA au Computex était évidemment tournée vers l’IA : « nous sommes à l’aube d’un changement majeur dans l’informatique », déclare le patron de l’entreprise Jensen Huang. « L’intersection de l’IA et de l’informatique accélérée est sur le point de redéfinir l’avenir ».

Sébastien Gavois

Le 03 juin à 11h34

9 min

Hardware

L’IA est partout : dans les cartes graphiques, les datacenters, les portables, les jeux, les applications… Bref, partout et pour tous, exactement comme le veut Emmanuel Macron.

Mais NVIDIA n’oublie pas (complètement) la partie hardware. S’il n’y a pas de grosses annonces, le patron de l’entreprise donne des détails sur la feuille de route des prochaines années, avec la prochaine génération de GPU pour les datacenters et l’IA. Il en profite aussi pour venir jouer les arbitres dans le domaine des mini-PC et de la compatibilité entre cartes graphiques et boîtiers.

Blackwell : voici GB200 NVL2, avec 2 CPU et 2 GPU

Pour le reste, il est surtout (et quasiment que) question d’intelligence artificielle chez NVIDIA, ce qui ne surprendra personne. L’entreprise caracole en tête des systèmes pour entrainer les IA avec ses GPU Hopper et la génération Blackwell à venir.

À ce propos, NVIDIA dévoile une nouvelle plateforme GB200 NVL2, avec deux GPU Blackwell et deux CPU Grace. La puce est donc proche du GB200 (1x CPU et 2x GPU), mais avec un CPU en plus. Le fabricant revendique jusqu’à 40 PFLOPS en FP4 et 10 PFLOPS en FP16 pour son GB200 NVL2.

- NVIDIA annonce son GPU Blackwell (B200) pour l’IA, jusqu’à 20 000 TFLOPS (FP4)

- Rapidité vs précision : deux experts nous expliquent les enjeux des GPU modernes sur les IA

IA : un nouveau GPU chaque année, Rubin (Ultra) après Blackwell (Ultra)

Lors de la conférence, Jensen Huang explique que la société va passer sur un « rythme d’un an » pour l’annonce des nouvelles puces. On apprend ainsi que Rubin (en hommage à Vera Rubin) succédera à Blackwell prévu pour cette année. Rubin devrait arriver en 2026, avec une version Ultra (plus de mémoire HBM3e.) de Blackwell en 2025 pour avoir le rythme d’une puce par an.

Assez peu de détails ont filtré sur Rubin, si ce n’est que le GPU utilisera de la HBM4 avec 8 stacks pour commencer (en 2025), puis 12 par la suite avec Rubin Ultra (probablement en 2026). La prochaine génération devrait donc arriver en 2027.

Une nouvelle partie CPU « Vera » est aussi attendue, alors que Hopper et Blackwell utilisent tous les deux un CPU « Grace » pour rappel. NVIDIA annonce aussi un NVLink 6 à 3,6 To/s et un CX9 SuperNIC à 1,6 Tb/s.

AMD et Intel arrivent sur la plateforme MGX

Comme les autres systèmes Blackwell et Hopper, le GB200 NVL2 est compatible avec la plateforme de référence MGX de NVIDIA pour la conception de serveurs. Cette dernière ajoute que, « à ce jour, plus de 90 systèmes de plus de 25 partenaires ont été lancés ou sont en cours de développement avec l’architecture de référence MGX, contre 14 systèmes de 6 partenaires l’année dernière ».

Toujours selon NVIDIA, AMD et Intel « soutiennent » cette plateforme et ont « l’intention de fournir, pour la première fois, leurs propres conceptions de modules de processeur hôte. Cela inclut la plate-forme AMD Turin de nouvelle génération et le processeur Intel Xeon 6 avec P-cores (anciennement Granite Rapids) ».

Cartes graphiques et boîtiers SFF-Ready

NVIDIA profite du Computex de Taipei pour lancer une nouvelle certification : « SFF-Ready ». SFF signifie pour rappel Small Form Factor, c’est-à-dire des ordinateurs de petite taille ou encore des mini-PC. Le fabricant part du constat que si les fabricants de cartes graphiques donnent bien les mensurations de leurs produits, « l'espace requis par les câbles d'alimentation et les connecteurs n’est généralement pas pris en compte ».

NVIDIA veut donc jouer les arbitres et assurer une compatibilité entre les cartes graphiques et les boîtiers. Pour les premières, il est question d’une mention « SFF-Ready Enthusiast GeForce Card », tandis que pour les seconds, on trouvera un « Compatible with SFF-Ready Enthusiast GeForce Cards ». NVIDIA précise que les « cartes graphiques gaming GeForce SFF-Ready sont des cartes RTX 4070 ou des modèles ultérieurs ». Les modèles de chez AMD et Intel sont donc laissés de côté.

Les cartes graphiques doivent répondre aux caractéristiques techniques suivantes : un maximum de 151 mm de hauteur avec le rayon de courbure du câble d’alimentation, de 304 mm en longueur et de 50 mm (soit 2,5 emplacements) en profondeur. NVIDIA annonce que 36 cartes graphiques GeForce de la série 40 sont compatibles dès le lancement, dont ses RTX 4070 (Super) Founder Edition.

Du côté du boitier, « un dégagement total de 154,5 mm sera requis entre la carte mère ou le riser du PCB et le côté ou le haut du boîtier », ainsi que 312 mm sur la longueur. Une vingtaine de boîtiers sont déjà compatibles.

Des « avatars numériques humains réalistes » avec NVIDIA ACE

Mais il n’y a pas que le hardware dans la vie, le logiciel occupe aussi une place importante. NVIDIA n’y va pas avec le dos de la cuillère et veut « transformer des millions de développeurs dans le monde en développeurs d’IA générative ».

Cela passe par NIM (NVIDIA Inference Microservices, annoncé en mars et disponible via AI Entreprise), un ensemble de micro services pour simplifier « le déploiement de modèles d’IA générative n’importe où, dans le cloud, les centres de données et les stations de travail accélérées par GPU ».

L’année dernière, ACE était présenté. Cette année, cette technologie (disponible via NVIDIA NIM) passe en « generally available » dans le cloud et en accès anticipé sur les PC « RTX AI ». NVIDIA cible large, et au-delà des simples joueurs.

La société parle, en effet, de « création, d’animation et d’utilisation d’avatars numériques humains réalistes dans le service client, la télésanté, les jeux et le divertissement ». On en parlait récemment dans les LIDD, avec un reportage de l’INA sur le floutage des visages et le besoin d’anonymat : « L’IA permet d’envisager l’émotion qu’on nous partage, mais sans révéler le témoin ».

LLM Nemotron-3 4.5B pour de l’inférence en local

Quoi qu’il en soit, ACE est un assemblage de plusieurs technologies. Riva ASR, TTS et NMT pour la reconnaissance et la synthèse vocale, ainsi que la traduction automatique. Audio2Face afin de proposer une animation faciale réaliste et alignée avec l’audio pour plus de réalisme. Omniverse RTX pour obtenir de la peau et des cheveux réalistes en temps réel…

Signalons aussi Nemotron LLM pour la compréhension du langage et la génération de réponses contextuelles. Un nouveau modèle Nemotron-3 4.5B est d’ailleurs de la partie : il est spécialement conçu pour de l’inférence sur les PC RTX AI, et donc en local.

- Intelligence artificielle : NVIDIA tire tous azimuts et compte révolutionner le jeu vidéo

G-Assist : une aide en direct pour les joueurs

Toujours à destination des joueurs et avec une bonne dose d’IA, NVIDIA dévoile son Project G-Assist. Il s’agit de proposer une « aide contextuelle pour les jeux et les applications PC ».

Sous le capot, cette technologie utilise des entrées vocales et textuelles ainsi qu’un instantané de la fenêtre de jeu. Les informations sont passées à la moulinette « d’un grand modèle de langage (LLM), qui est connecté à une base de données de connaissances de jeu telle qu’un wiki ».

Il recrache ensuite la réponse, sous forme d’une aide. Une version 2.0 des magazines d’astuces et de guides que l’on achetait à une époque chez les marchands de journaux.

Les intelligences artificielles peuvent bien évidemment être exécutées dans le cloud, mais aussi localement sur des ordinateurs RTX AI. Les attentes de NVIDIA sont grandes : « Nous envisageons que les assistants IA transforment la façon dont nous interagissons avec nos jeux et nos applications préférés ». En attendant, une démonstration avec ARK : Survival Ascended a été mise en ligne.

Des portables « RTX AI » arrivent, avec Copilot+

Et puisqu’on parle de RTX AI PC, NVIDIA explique que les premiers ordinateurs portables RTX AI arrivent. Ils viendront s’ajouter aux « plus de 100 millions de PC RTX AI » (en version desktop) actuellement dans le monde.

Les premiers modèles viennent de chez ASUS et MSI – avec un CPU AMD Strix, comme précisé par The Verge –, mais plus de 200 références sont attendues. NVIDIA précise que ces machines recevront une mise à jour gratuite vers Copilot+ PC quand il sera disponible.

Il a pour rappel été annoncé par Microsoft avec les machines équipées d’un SoC Arm avec NPU (moteur neuronal). Microsoft parlait uniquement des puces Snapdragon X et Elite (Plus), mais laissait la voie ouverte à d’autres CPU : il « suffit » en effet d’avoir une partie NPU pour être éligible à Copilot+.

Les cartes graphiques de NVIDIA disposent depuis longtemps de fonctionnalités liées à l’intelligence artificielle et sont pour certaines capables de faire largement mieux qu’un NPU. La question n’est donc pas la puissance. NVIDIA ne précise pas quand cette mise à jour Copilot+ arrivera. La disponibilité et la livraison des premières machines Copilot+ est pour rappel programmée pour le 18 juin.

- Voilà les Copilot+ : des PC avec Windows 11 Arm, IA et Snapdragon X

L’application NVIDIA passe au AV1 pour les vidéos

Bien d’autres annonces ont été faites par NVIDIA, notamment avec une mise à jour de son application qui permet d’enregistrer des vidéos AV1 (SDR et HDR) jusqu’à 120 FPS.

Par rapport au H.264, les avantages sont nombreux selon la société : « il y a moins d’artefacts de blocs, le color banding est réduit [effet d’escalier sur les dégradés, ndlr] et beaucoup plus de détails sont préservés dans les scènes en accélérée ». Un exemple est disponible avec Horizon Forbidden West Complete Edition.

D’autres changements sont détaillés dans les notes de version.

Commentaires (4)

RuMaRoCO Abonné

Le 03/06/2024 à 12h37

Quand Je vois autan de AI je ne sais pas pourquoi j'ai la musique de "preparation H" qui me revient en tête.

http://www.culturepub.fr/videos/preparation-h-le-tabouret/

Albirew Abonné

Le 04/06/2024 à 00h51

d'ailleurs, si quelqu'un a le nom de ce flamenco, je suis preneur

TheKillerOfComputer Abonné

Modifié le 03/06/2024 à 20h49

G-Assist

C'est encore pire que je ne le pensais. On a ressucité Clippit et on lui donne les clés du système vu qu'il peut même overclocker à notre place. J'ai hâte de voir les gens gueuler car l'IA leur aura cramé une ou deux pièces... Sans compter qu'il a donc accès à toutes les informations du système par une télémétrie encore plus insidieuse que j'espère nous pourrons couper.

Et les énormités du genre de l'exemple dans la vidéo « Pour optimiser votre système avec son écran 4K tournant à 60 Hz, vous devriez activer la fréquence native de l'écran qui est de 240 Hz », ça n'a rien d'une optimisation ou alors je n'ai pas la même définition de ce mot. Les forums vont être amusants à lire

A part cela, ce niveau d'assistance est risible. Autant regarder un walkthrough sur Youtube si vous ne voulez pas jouer. D'ailleurs, qui va feeder l'IA avec les informations requises pour les conseils vu qu'elle est incapable de créer de la matière première ? Parce que si les joueurs commencent à massivement utiliser G-Assist, ça risque d'être très drôle s'il n'y a personne pour fournir. Et j'ai très envie de faire le troll en modifiant des Wikis juste pour saboter les efforts des newbies car je sais que l'IA leur soufflera mon sabotage (si j'ai eu cette idée alors d'autres l'auront et la différence avec moi est qu'ils l'appliqueront).

C'est vraiment tout ce qu'on a trouvé pour « vendre » l'IA partout pour tous ?

HerrFrance Abonné

Le 04/06/2024 à 08h19

Wahou, j'ai trop envie de devenir un dev d'IA, de faire ça avec de l'IA et en plus de laisser l'IA se détendre dans les jeux à ma place...