À la découverte de Jalapeño, la première puce d’OpenAI pour l’IA générative

Le peuple réclame les PetaFLOPS !!!

Sébastien Gavois

Le 25 juin à 15h31

OpenAI présente sa première puce dédiée à l’inférence, développée avec Broadcom. L’entreprise affirme que les premiers tests se passent bien, mais ne donne aucun chiffre précis sur les performances, la consommation, etc. La photo d’un wafer permet de se lancer dans quelques analyses.

À la découverte de Jalapeño, la première puce d’OpenAI pour l’IA générative

Le peuple réclame les PetaFLOPS !!!

Sébastien Gavois

Le 25 juin à 15h31

Hardware

6 min

En octobre, nous apprenions qu’OpenAI et Broadcom travaillaient main dans la main pour développer des puces dédiées à l’intelligence artificielle. Contrairement aux GPU généralistes, il est ici question d’ASIC spécialisées.

Économie

OpenAI mange à tous les râteliers : après AMD et NVIDIA, c’est au tour de Broadcom

Économie

Mardi 14 octobre 2025 à 08h30 14/10/2025 08h30

18

Des algos à la puce, OpenAI passe en mode « full stack »

Ce n’est pas la première société à venir jouer sur les plates-bandes de NVIDIA. Google est déjà à sa huitième génération de TPU, Amazon et Microsoft sont aussi sur les rangs. C’est donc au tour d’OpenAI de se lancer. L’entreprise connait bien le sujet des IA génératives et de leurs besoins en calculs puisqu’elle était la première à se lancer avec ChatGPT (désormais en version 5.5).

Elle s’appuie sur la connaissance des LLM et de leurs besoins (passés, actuels et à venir) pour développer les fonctionnalités matérielles nécessaires. OpenAI se présente ainsi comme « full stack ». Sur la partie matérielle, le responsable d’OpenAI (Richard Ho) est un ancien de Google qui a passé plus de huit ans sur les TPU, il connait donc bien le sujet. Pour OpenAI, l’enjeu est double : se détacher de NVIDIA et de ses GPU, mais aussi avoir des puces plus spécialisées et optimisées afin de réduire la consommation (et donc le coût énergétique).

Hardware

#Nextquick Pourquoi tout le monde se jette encore sur les GPU NVIDIA pour l’IA

Hardware

Vendredi 12 juin 2026 à 09h39 12/06/2026 09h39

26

OpenAI affirme que sa « première génération d’accélérateurs offrira des performances par watt nettement supérieures à celles des accélérateurs de pointe actuels ». Sa puce a été « conçue dès le départ pour répondre aux besoins actuels et futurs des LLM », ceux d’OpenAI mais aussi les autres. Attention, cela ne veut pas dire que tout le monde pourra en profiter ; selon Reuters, les puces d’OpenAI seraient utilisées uniquement par OpenAI. Est-ce que ce sera une exclusivité totale, ou bien des puces seront-elles mises à disposition dans ses datacenters (comme le fait Google avec ses TPU) ? À voir…

OpenAI affirme que de premiers échantillons (samples) de Jalapeño « exécutent des charges de travail en machine learning en laboratoire à la fréquence et à la puissance prévues pendant la phase de production, y compris GPT‑5.3‑Codex‑Spark ». Aucun détail toutefois sur les performances ni sur les caractéristiques techniques.

On ne parle pour le moment que d’inférence, c’est-à-dire quand le modèle répond ; pas de la phase d’entrainement qui précède.

Caractéristiques techniques et performances ? Circulez, il n’y a rien à voir…

Il faut se contenter de promesses floues : « Bien qu’OpenAI mesure encore la performance finale, les premiers tests montrent que Jalapeño offrira des performances par watt nettement supérieures à l’état de l’art actuel ». Un rapport technique sera publié dans les prochains mois.

Hock Tan, président et CEO (équivalent de PDG) de Broadcom affirme qu’en « co-développant directement avec OpenAI notre puce de pointe, nous permettons le déploiement de centres de données à l’échelle du GW avec Microsoft et d’autres partenaires dès 2026 ».

Niveau partenariat, OpenAI cite également Broadcom sur la partie réseau avec son Tomahawk, dont la version 6 (102,4 Tb/s de bande passante totale) peut atteindre 1,6 Tb/s en Ethernet, 128 x 800 GbE, 256 x 400 GbE ou 512 x 200 GbE. C’est le double de la version 5, mais toujours sans savoir quelle version est utilisée.

Celestica est aussi cité comme partenaire, afin de « contribuer à l’industrialisation de la plateforme grâce à l’intégration de puces, de cartes, de baies, de réseaux haute performance et de systèmes de production évolutifs », précise OpenAI.

Maintenant que les présentations officielles sont faites, passons à la partie technique. Peu de données sont indiquées, mais la photo du wafer et de la puce d’OpenAI permet de se lancer dans quelques déductions et prospections.

Ce que nous apprend la photo officielle du wafer

Il reste 32% de l'article à découvrir.

Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.

Accédez en illimité aux articles

Profitez d'un média expert et unique

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Abonnez-vous

La suite de cet article est réservée à nos abonnés

Soutenez un journalisme indépendant,
expert et sans pub.

Abonnez-vous sur next.ink/subs

Commentaires (7)

Aqua Premium

Le 25 juin à 15h52

2 marques de bons goût, à la réputation exemplaire toutes les deux, qui auront certainement une encore meilleure réputation à l'avenir.

/s (obviously)

graveen Premium

Le 25 juin à 16h06

Rien à ajouter

bingo.crepuscule Premium

Modifié le 25 juin à 17h58

Je rajouterais que leur modèle "spark" c'est de la daube, qui fait un travail bien moins intéressant que les modèles standards 5.3, 5.4 et 5.5...

dante_elysium Premium

Le 26 juin à 09h27

"une soixantaine de dies en théorie par wafer ; ceux sur les bords sont incomplets et inutilisables."

Question peut-être bête, mais pourquoi les wafer sont rond ? Pourquoi pas carrés ou rectangulaires pour ne pas avoir les pertes avec des dies incomplets ?

Sébastien Gavois Équipe

Le 26 juin à 10h38

C’est, de mémoire, principalement à cause du procédé de fabrication qui donne des galettes rondes.

fofo9012 Premium

Le 3 juillet à 08h12

C'est un gros cylindre coupé en rondelles très fine

sirchamallow Premium

Modifié le 26 juin à 11h08

A quelque jour à peine des annonces de Qualcomm lors de son Investor Day: CPU data center Dragonfly C1000 / l’accélérateur d’inférence Dragonfly AI300 / la technologie Qualcomm High Bandwidth Compute.