Avec ses TPU Ironwood, Google passe à « l’ère de l’inférence »… avec de gros chiffres
Un agent IA avec Ironwood, c’est un Ironman ?

Google vient de présenter sa 7ᵉ génération de TPU pour les calculs liés à l’intelligence artificielle. L’accent est mis sur l’inférence et l’IA agentique, avec de gros chiffres qui ne veulent pas forcément dire grand-chose en l’état.
Le 09 avril à 18h23
5 min
Hardware
Hardware
L’année dernière, au mois de mai, Google profitait de sa conférence annuelle I/O pour présenter son Tensor Processing Unit (TPU) de 6ᵉ génération : Trillium (alias TPU v6). Il s’agit pour rappel d’un ASIC (circuits intégrés spécifiques aux applications) conçu « pour accélérer les charges de travail de machine learning ».
La génération précédente avait eu droit à deux versions : v5e avec le meilleur rapport performances/prix, selon Google, et v5p (lancée plus tard) pour les performances brutes. Maintenant que le décor est planté, passons à la 7ᵉ génération, alias Ironwood. Elle « offre des niveaux inédits d’efficacité et de performance », affirme le fabricant.


Vers la « génération proactive d'idées et d'interprétations »
Selon Google, Ironwood apporterait un changement significatif dans le développement de l’IA : « Il s’agit de passer de modèles d’IA réactifs qui fournissent des informations en temps réel à des utilisateurs, à des modèles qui proposent de la génération proactive d'idées et d'interprétations. C’est ce que nous appelons "l’ère de l’inférence" où les agents d’IA récupèrent et génèrent de manière proactive des données pour fournir de manière collaborative des informations et des réponses, pas seulement des données ».
Ironwood vise évidemment les grands modèles de langage (LLMs), mais aussi les Mixture of Experts (MoE), à la mode ces dernières semaines. Meta y est passé récemment avec Llama 4 par exemple, même chose pour DeepSeek.
La foire des chiffres, on vous explique (comme on peut)
Il reste 63% de l'article à découvrir.
Déjà abonné ? Se connecter

Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.
Accédez en illimité aux articles
Profitez d'un média expert et unique
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
Abonnez-vousAvec ses TPU Ironwood, Google passe à « l’ère de l’inférence »… avec de gros chiffres
-
Vers la « génération proactive d'idées et d'interprétations »
-
La foire des chiffres, on vous explique (comme on peut)
-
4 614 TFLOPS par puce, avec 192 Go de HBM
-
Google veut se frotter à El Capitan… sans donner de détails
-
Blackwell sur les VM a4 et A4X, Vera Rubin en approche
Commentaires (5)
Le 09/04/2025 à 19h17
Le 09/04/2025 à 19h57
Le 09/04/2025 à 21h54
Le 10/04/2025 à 08h43
Un point important, c'est la consommation par opération, quel est-elle ? par ce que
Ca ne donne pas vraiment les chiffres, surtout en comparaison à d'autres solutions.
Modifié le 10/04/2025 à 11h27
retiré. Commentaire qui ne sert à rien.