Le supercalculateur Jean-Zay en pause pour mise à jour, les chercheurs bloqués
Ça fait Zayer
Comme promis, le supercalculateur Jean-Zay est en train d’être amélioré pour augmenter sa puissance de calcul d’un facteur x4 selon Emmanuel Macron ou… x10 selon la DGE. Qu’importe, les travaux ont commencé, mais les principaux concernés, les chercheurs, ont été prévenus au dernier moment et se retrouvent un peu le bec dans l’eau.
Le 08 février à 08h25
4 min
IA et algorithmes
IA
En juin dernier, à VivaTech, Emmanuel Macron annonçait le financement d'une myriade de projets informatiques dont l'augmentation des performances du supercalculateur du CNRS Jean Zay.
De « x4 avec assez peu de frais »…
Il est pour rappel installé à l'IDRIS (Institut du développement et des ressources en informatique scientifique) depuis 2019. Il disposait à ces débuts d'une puissance crête de 15,9 PFlop/s. Il est passé à 28 PFlop/s au cours de l'été 2020 avec sa première extension. Une seconde en juin 2022 a porté sa puissance de calcul à 36,85 PFlop/s.
« À court terme, on va investir 50 millions pour quadrupler les capacités du supercalculateur Jean Zay. On a déjà investi 40 millions, c'est quelque chose qui nous permet d'être dans la partie. On peut faire x4 avec assez peu de frais [...] on le fait tout de suite pour monter très vite ». Emmanuel Macron ne précisait par contre pas de quoi il était question précisément sur le « x4 ».
… à une « multiplication par 10 » des capacités de Jean Zay
Il est parfois difficile de suivre puisque, dans son rapport d’activité 2023, la Direction générale des entreprises (DGE) explique avoir « structuré une stratégie nationale dédiée à l’intelligence artificielle générative qui repose sur le renforcement de nos capacités de calcul, notamment la multiplication par 10 des capacités du supercalculateur Jean Zay, pouvant entraîner à terme 4 à 5 grands modèles de langage par an ».
Le CNRS précise que la conception de Jean-Zay « permet d'étendre les modes d'utilisation classiques du calcul de haute performance (HPC) à de nouveaux usages pour l’intelligence artificielle (IA) ». Il est constitué de CPU et de GPU, tandis que la mise à jour prévoit de remplacer une partie des CPU par des GPU. Ces derniers sont largement utilisés pour tout ce qui touche à l’intelligence artificielle.
Une bonne nouvelle peut en cacher une mauvaise
Une très bonne nouvelle, a priori, pour les utilisateurs du supercalculateur, dont nombreux sont des chercheurs des diverses institutions et laboratoires français. Mais, Le Monde explique, dans un article publié lundi 5 février, que le planning de cette mise à jour a été annoncé très tard : les chercheurs n'ont été prévenus qu'à la mi-janvier pour un arrêt ce lundi même.
La machine n'est que partiellement arrêtée, mais cette pause d'une partie des processeurs (53 % des capacités de calcul CPU) bloque des travaux de recherche qui étaient prévus et qui ne peuvent être fait ailleurs si facilement.
« On avait prévu ça plutôt en 2026 », reconnait Adeline Nazarenko, toute nouvelle directrice de l’institut des sciences de l'information et de leurs interactions du CNRS, interrogée par Le Monde. Le journal évoque plusieurs cas de chercheurs bloqués par les difficultés de reprogrammation de leurs calculs.
La communauté scientifique « prise de court »
« Toute la communauté scientifique qui travaille sur les modèles du climat, qui alimentent notamment les prévisions du GIEC [Groupe d’experts intergouvernemental sur l’évolution du climat], a été prise de court par cette opération qui rend caduc le travail de planification à long terme en cours » explique, par exemple, Julie Deshayes, directrice de recherche du CNRS et chercheuse en océanographie physique.
Les procédures des marchés publics et un calendrier serré prévoyant une mise à jour opérationnelle avant l'été 2024 ont contraint à ce que l'annonce de la date se fasse tardivement.
Le supercalculateur Jean-Zay en pause pour mise à jour, les chercheurs bloqués
-
De « x4 avec assez peu de frais »…
-
… à une « multiplication par 10 » des capacités de Jean Zay
-
Une bonne nouvelle peut en cacher une mauvaise
-
La communauté scientifique « prise de court »
Commentaires (15)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 08/02/2024 à 10h16
Le 08/02/2024 à 10h21
Puissance d'origine 10 : 15.910 = 159 PFlops
Puissance actuelle 4 : 36.854 = 147.4 PFlops
A la louche, ce sera entre les deux, autour de 150 PFlop la cible.
Même si chacun parle de ce qu'il veut, le calcul et le rapprochement aurait pu être tenté par l'auteur de l'article lui-même. C'est normalement ça aussi qui est attendu de la part des auteurs de Next, un article plus fouillé.
Le 08/02/2024 à 10h24
Le problème principal est la durée de l'arrêt : 4 mois.
Le 08/02/2024 à 10h53
Le 08/02/2024 à 12h39
Le 08/02/2024 à 17h43
Mais surtout ces histoires de petaflops ça n'intéresse que les politiques pour de l'affichage. L'utilisateur il s'en fiche, il veut que son calcul aille vite. Et tous les calculs ne sont pas des multiplications de matrices vectorisables à l'infini. Et encore moins en demi-précision. On jette à la benne des machines CPU pour y mettre à la place des GPU orientés IA (et c'est à craindre un fléchage IA pour les attributions d'heures). Le calcul de chimie quantique sur des niveaux de précision élevés avec Gaussian va avoir des performances désastreuses (si jamais ça tourne, compatibilité: uniquement K40, K80, P100, V100 et A100) Et des logiciels inadaptés voire incompatibles GPU il y en a des paquets en science.
Le 08/02/2024 à 10h51
Le 08/02/2024 à 11h31
Le 08/02/2024 à 14h59
Le 08/02/2024 à 16h37
Modifié le 08/02/2024 à 18h18
Le 08/02/2024 à 16h01
Est-ce qu’on pourrait expliquer plus précisément ce paragraphe ?
Modifié le 08/02/2024 à 16h35
Tu as un budget public à dépenser avant une date buttoir, du coup tu fais un cahier des charges avec des délais serrés pour la livraison et la mise en prod, en l'occurrence la mise à jour opérationnelle pour l'été 2024. Ensuite le serpent se mord la queue parce que la procédure d'attribution du marché prend largement plus de temps que prévu et grignote le peu de mou que tu avais prévu pour l'exécution du marché, et tu te retrouves avec un fournisseur qui pousse l'installation au plus vite, parce qu'il doit absolument respecter les délais que tu as fixés (et qu'il a acceptés), sous peine d'amendes.
Le 08/02/2024 à 17h34
Le 09/02/2024 à 13h31