Connexion Premium

À la découverte de Jalapeño, la première puce d’OpenAI pour l’IA générative

Le peuple réclame les PetaFLOPS !!!

À la découverte de Jalapeño, la première puce d’OpenAI pour l’IA générative

OpenAI présente sa première puce dédiée à l’inférence, développée avec Broadcom. L’entreprise affirme que les premiers tests se passent bien, mais ne donne aucun chiffre précis sur les performances, la consommation, etc. La photo d’un wafer permet de se lancer dans quelques analyses.

En octobre, nous apprenions qu’OpenAI et Broadcom travaillaient main dans la main pour développer des puces dédiées à l’intelligence artificielle. Contrairement aux GPU généralistes, il est ici question d’ASIC spécialisées.

Des algos à la puce, OpenAI passe en mode « full stack »

Ce n’est pas la première société à venir jouer sur les plates-bandes de NVIDIA. Google est déjà à sa huitième génération de TPU, Amazon et Microsoft sont aussi sur les rangs. C’est donc au tour d’OpenAI de se lancer. L’entreprise connait bien le sujet des IA génératives et de leurs besoins en calculs puisqu’elle était la première à se lancer avec ChatGPT (désormais en version 5.5).

Elle s’appuie sur la connaissance des LLM et de leurs besoins (passés, actuels et à venir) pour développer les fonctionnalités matérielles nécessaires. OpenAI se présente ainsi comme « full stack ». Sur la partie matérielle, le responsable d’OpenAI (Richard Ho) est un ancien de Google qui a passé plus de huit ans sur les TPU, il connait donc bien le sujet. Pour OpenAI, l’enjeu est double : se détacher de NVIDIA et de ses GPU, mais aussi avoir des puces plus spécialisées et optimisées afin de réduire la consommation (et donc le coût énergétique).

OpenAI affirme que sa « première génération d’accélérateurs offrira des performances par watt nettement supérieures à celles des accélérateurs de pointe actuels ». Sa puce a été « conçue dès le départ pour répondre aux besoins actuels et futurs des LLM », ceux d’OpenAI mais aussi les autres. Attention, cela ne veut pas dire que tout le monde pourra en profiter ; selon Reuters, les puces d’OpenAI seraient utilisées uniquement par OpenAI. Est-ce que ce sera une exclusivité totale, ou bien des puces seront-elles mises à disposition dans ses datacenters (comme le fait Google avec ses TPU) ? À voir…

OpenAI affirme que de premiers échantillons (samples) de Jalapeño « exécutent des charges de travail en machine learning en laboratoire à la fréquence et à la puissance prévues pendant la phase de production, y compris GPT‑5.3‑Codex‑Spark ». Aucun détail toutefois sur les performances ni sur les caractéristiques techniques.

On ne parle pour le moment que d’inférence, c’est-à-dire quand le modèle répond ; pas de la phase d’entrainement qui précède.

Caractéristiques techniques et performances ? Circulez, il n’y a rien à voir…

Il faut se contenter de promesses floues : « Bien qu’OpenAI mesure encore la performance finale, les premiers tests montrent que Jalapeño offrira des performances par watt nettement supérieures à l’état de l’art actuel ». Un rapport technique sera publié dans les prochains mois.

Hock Tan, président et CEO (équivalent de PDG) de Broadcom affirme qu’en « co-développant directement avec OpenAI notre puce de pointe, nous permettons le déploiement de centres de données à l’échelle du GW avec Microsoft et d’autres partenaires dès 2026 ».

Niveau partenariat, OpenAI cite également Broadcom sur la partie réseau avec son Tomahawk, dont la version 6 (102,4 Tb/s de bande passante totale) peut atteindre 1,6 Tb/s en Ethernet, 128 x 800 GbE, 256 x 400 GbE ou 512 x 200 GbE. C’est le double de la version 5, mais toujours sans savoir quelle version est utilisée.

Celestica est aussi cité comme partenaire, afin de « contribuer à l’industrialisation de la plateforme grâce à l’intégration de puces, de cartes, de baies, de réseaux haute performance et de systèmes de production évolutifs », précise OpenAI.

Maintenant que les présentations officielles sont faites, passons à la partie technique. Peu de données sont indiquées, mais la photo du wafer et de la puce d’OpenAI permet de se lancer dans quelques déductions et prospections.

Ce que nous apprend la photo officielle du wafer

Il reste 32% de l'article à découvrir.

Cadenas en colère - Contenu premium

Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.

Accédez en illimité aux articles

Profitez d'un média expert et unique

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Commentaires (2)

votre avatar
2 marques de bons goût, à la réputation exemplaire toutes les deux, qui auront certainement une encore meilleure réputation à l'avenir.

/s (obviously)
votre avatar
Rien à ajouter :D