Des GPU A100 (Ampere) de NVIDIA dans six supercalculateurs, Atos annonce son BullSequana X2415

Des GPU A100 (Ampere) de NVIDIA dans six supercalculateurs, Atos annonce son BullSequana X2415

13 000 GPU aux États-Unis et en Allemagne

Avatar de l'auteur

Sébastien Gavois

Publié dansHardware

19/05/2020
6
Des GPU A100 (Ampere) de NVIDIA dans six supercalculateurs, Atos annonce son BullSequana X2415

 À peine dévoilés, les nouveaux GPU A100 de NVIDIA prennent place dans plusieurs supercalculateurs : quatre projets sont annoncés aux États-Unis et deux en Allemagne, pour un total de 13 000 GPU environ. En Europe, le français Atos « lance le premier supercalculateur équipé des GPU NVIDIA A100 ».

Jeudi, NVIDIA présentait son premier GPU de la génération Ampere : A100. Pensé pour les datacenters, il est gravé en 7 nm et comporte pas moins de 54,2 milliards de transistors. Disponible, il doit d'ores et déjà intégrer plusieurs supercalculateurs un peu partout dans le monde.

Atos l'utilisera dans son BullSequana X2415 qui « fournira une puissance de calcul jamais atteinte jusqu’à présent et accélérera les performances des applications de HPC et d’IA [...] multipliera par plus de deux fois la puissance de calcul et optimisera la consommation d’énergie, grâce à la solution brevetée DLC (Direct Liquid Cooling) d’Atos qui refroidit totalement le système en utilisant de l'eau chaude ».

Quatre GPU A100, deux CPU EPYC et 512 Go de mémoire par lame

Cette lame est basée sur un design HGX-A100 comprenant quatre GPU A100 interconnectés via des NVLink de 3e génération. Comme l'a fait NVIDIA pour ses propres serveurs, les CPU passent chez AMD puisqu'il s'agit d'EPYC en 7 nm (Milan, sans plus de précision). Un choix déjà fait par Atos sur d'autres produits.

512 Go (16 x 32 Go) de DDR4 accompagnent l'ensemble et jusqu’à quatre ports InfiniBand (NVIDIA Mellanox) pour une topologie de type Dragonfly+. Un SSD M.2 S-ATA ou NVMe est proposé en option.

La disponibilité est prévue d’ici fin juin.

BullSequana X2415

Le Centre de recherche de Jülich – qui participe notamment aux projets « Humain Brain » de la Commission européenne, ainsi que « Science du Climat » et « Systèmes moléculaires » – sera le premier à l'utiliser affirme Atos. Le supercalculateur JUWELS sera ainsi mis à jour avec des lames BullSequana X2415 (et donc des GPU A100).

Il devrait alors « atteindre un pic de performance de plus de 70 pétaFLOPS, devenant ainsi le supercalculateur le plus puissant d’Europe ».

13 000 GPU A100 pour six projets de supercalculateurs

De son côté, NVIDIA annonce que cinq supercalculateurs à travers le monde se préparent à passer à Ampere. Le laboratoire national d'Argonne aux États-Unis va ainsi utiliser un cluster composé de 24 unités DGX A100, chacune comprenant 8 GPU A100 (soit 192 au total) et six NVSwitch de nouvelle génération.

Toujours outre-Atlantique, le National Energy Research Scientific Computing Center (NERSC) de Berkeley (en Californie) travaille avec HPE afin de déployer pas moins de 6 200 GPU A100 dans le supercalculateur Perlmutter. Deux des projets du NERSC utilisent déjà des prototypes de GPU Ampere avec, selon NVIDIA, « une augmentation significative des performances par rapport aux GPU Volta ».

Signalons aussi l’université de l’Indiana et son système Big Red 200 comprenant 256 GPU Ampere pour une puissance de 6 pétaFLOPS. Des recherches en cybersécurité et génétique y seront menées. 

En Allemagne, outre le Centre de recherche de Jülich, le Karlsruhe Institute of Technology (KIT) s’est associé à Lenovo pour un nouveau supercalculateur de 17 pétaFLOPS comprenant 740 GPU A100.

Il effectuera des calculs pour des simulations climatiques, de la recherche autour de Covid-19, de nouveaux matériaux pour les batteries, etc. Le Max Planck Institute mise aussi sur Lenovo pour son Raven-GPU, avec 768 GPU cette fois. Il servira aux recherches en astrophysique, biologie, chimie théorique et science des matériaux. 

Au total, les six projets de supercalculateurs – quatre aux États-Unis et deux en Allemagne – « utiliseront près de 13 000 GPU A100 », déclare NVIDIA. D’autres devraient suivre.

6
Avatar de l'auteur

Écrit par Sébastien Gavois

Tiens, en parlant de ça :

#Flock a sa propre vision de l’inclusion

Retour à l’envoyeur

13:39 Flock 15
Un Sébastien transformé en lapin par Flock pour imiter le Quoi de neuf Docteur des Looney Tunes

Quoi de neuf à la rédac’ #10 : nous contacter et résumé de la semaine

On est déjà à la V2 de Next ?

11:55 20
Autoportrait Sébastien

[Autoportrait] Sébastien Gavois : tribulations d’un pigiste devenu rédac’ chef

Me voilà à poil sur Internet

17:18 Next 16

Sommaire de l'article

Introduction

Quatre GPU A100, deux CPU EPYC et 512 Go de mémoire par lame

13 000 GPU A100 pour six projets de supercalculateurs

#Flock a sa propre vision de l’inclusion

Flock 15
Un Sébastien transformé en lapin par Flock pour imiter le Quoi de neuf Docteur des Looney Tunes

Quoi de neuf à la rédac’ #10 : nous contacter et résumé de la semaine

20
Autoportrait Sébastien

[Autoportrait] Sébastien Gavois : tribulations d’un pigiste devenu rédac’ chef

Next 16
Logo de StreetPress

Pourquoi le site du média StreetPress a été momentanément inaccessible

Droit 10
Amazon re:Invent

re:Invent 2023 : Amazon lance son assistant Q et plusieurs services IA, dont la génération d’images

IA 10
Un œil symbolisant l'Union européenne, et les dissensions et problèmes afférents

Le Conseil de l’UE tire un bilan du RGPD, les États membres réclament des « outils pratiques »

Droit 4

19 associations européennes de consommateurs portent plainte contre Meta

DroitSocials 14

#LeBrief : Ariane 6 l’été prochain, Nextcloud rachète Roundcube, désinformation via la pub

Chiffre et formules mathématiques sur un tableau

CVSS 4.0 : dur, dur, d’être un expert !

Sécu 8
Une tête de fusée siglée Starlink.

Starlink accessible à Gaza sous contrôle de l’administration israélienne

Web 34
Fibre optique

G-PON, XGS-PON et 50G-PON : jusqu’à 50 Gb/s en fibre optique

HardWeb 51
Photo d'un immeuble troué de part en part

Règlement sur la cyber-résilience : les instances européennes en passe de conclure un accord

DroitSécu 10
lexique IA parodie

AGI, GPAI, modèles de fondation… de quoi on parle ?

IA 7

#LeBrief : logiciels libres scientifiques, fermeture de compte Google, « fabriquer » des femmes pour l’inclusion

livre dématérialisé

Des chercheurs ont élaboré une technique d’extraction des données d’entrainement de ChatGPT

IAScience 3
Un chien avec des lunettes apprend sur une tablette

Devenir expert en sécurité informatique en 3 clics

Sécu 11
Logo ownCloud

ownCloud : faille béante dans les déploiements conteneurisés utilisant graphapi

Sécu 16
Le SoC Graviton4 d’Amazon AWS posé sur une table

Amazon re:invent : SoC Graviton4 (Arm), instance R8g et Trainium2 pour l’IA

Hard 12
Logo Comcybergend

Guéguerre des polices dans le cyber (OFAC et ComCyberMi)

Sécu 10

#LeBrief : faille 0-day dans Chrome, smartphones à Hong Kong, 25 ans de la Dreamcast

Mur d’OVHcloud à Roubaix, avec le logo OVHcloud

OVHcloud Summit 2023 : SecNumCloud, IA et Local Zones

HardWeb 2
algorithmes de la CAF

Transparence, discriminations : les questions soulevées par l’algorithme de la CAF

IASociété 62

Plainte contre l’alternative paiement ou publicité comportementale de Meta

DroitIA 38
Nuage (pour le cloud) avec de la foudre

Économie de la donnée et services de cloud : l’Arcep renforce ses troupes

DroitWeb 0
De vieux ciseaux posés sur une surface en bois

Plus de 60 % des demandes de suppression reçues par Google émanent de Russie

Société 7
Une vieille boussole posée sur un plan en bois

La Commission européenne et Google proposent deux bases de données de fact-checks

DroitWeb 3

#LeBrief : des fichiers Google Drive disparaissent, FreeBSD 14, caméras camouflées, OnePlus 12

Le poing Dev – round 6

Next 151

Produits dangereux sur le web : nouvelles obligations en vue pour les marketplaces

Droit 9
consommation de l'ia

Usages et frugalité : quelle place pour les IA dans la société de demain ?

IA 12

La NASA établit une liaison laser à 16 millions de km, les essais continuent

Science 17
Concept de CPU

Semi-conducteurs : un important accord entre l’Europe et l’Inde

Hard 7

#LeBrief : PS5 Slim en France, Valeo porte plainte contre NVIDIA, pertes publicitaires X/Twitter

Un mélange entre une réunion d’Anonymous et de tête d’ampoules, pour le meilleur et le pire

651e édition des LIDD : Liens Intelligents Du Dimanche

Web 30
next n'a pas de brief le week-end

Le Brief ne travaille pas le week-end.
C'est dur, mais c'est comme ça.
Allez donc dans une forêt lointaine,
Éloignez-vous de ce clavier pour une fois !

Commentaires (6)


Gilbert_Gosseyn Abonné
Il y a 4 ans

Comme quoi, niveau CPU serveurs, AMD gagne des points …


LordZurp Abonné
Il y a 4 ans

en fait, NVidia a fait un kickstarter caché et les labos tippeurs vont recevoir leur contrepartie en A100 :fumer:


ElRabbit Abonné
Il y a 4 ans

“Refroidi à l’eau chaude”: il n’y a pas à dire l’innovation informatique française reste à la pointe


barlav Abonné
Il y a 4 ans

ElRabbit a dit:


“Refroidi à l’eau chaude”: il n’y a pas à dire l’innovation informatique française reste à la pointe




Ca m’a fait sourire aussi, mais a 400W la puce, quand tu en as 4 ou 8 par lame, l’eau chauffe vite à mon avis.
L’eau n’est qu’un vecteur pour drainer des watts, et c’est foutrement plus efficace que l’air pour ça.
:chinois:


DoWnR Abonné
Il y a 4 ans

barlav a dit:


Ca m’a fait sourire aussi, mais a 400W la puce, quand tu en as 4 ou 8 par lame, l’eau chauffe vite à mon avis. L’eau n’est qu’un vecteur pour drainer des watts, et c’est foutrement plus efficace que l’air pour ça. :chinois:




C’est surtout que c’est nettement moins énergivore de directement refroidir les composants avec de l’eau “chaude” à 35-40°C, plutôt que de refroidir inutilement des m³ d’air avec de l’eau “glacée” à 12-15°C. Le côté négatif, c’est que ce que tu ne dépenseras pas sur ta facture d’électricité, tu vas le dépenser en cuivre, aluminium et renforcement du plancher de ton datacenter qui va devoir supporter tout ce poids supplémentaire :D


the_Grim_Reaper Abonné
Il y a 4 ans

DoWnR a dit:


C’est surtout que c’est nettement moins énergivore de directement refroidir les composants avec de l’eau “chaude” à 35-40°C, plutôt que de refroidir inutilement des m³ d’air avec de l’eau “glacée” à 12-15°C. Le côté négatif, c’est que ce que tu ne dépenseras pas sur ta facture d’électricité, tu vas le dépenser en cuivre, aluminium et renforcement du plancher de ton datacenter qui va devoir supporter tout ce poids supplémentaire :D




Sauf que le coût d’exploitation annuel d’un DC c’est à 60% la clim dans la plupart des cas.
Puis ton plancher tu peux le garder sur le HPC actuel, mais sur les suivants aussi. Le système de cuivre, si l’intégrateur est bon, tu peux t’en resservir à l’identique (ou presque) sur le prochain HPC (même placement de socket, dissipation thermique similaire pour le système global).



IBM a un système similaire, les lames sont plug and play avec le système de refroidissement intégré à la baie et au batiment. Et si tu restes chez eux, les emplacements sont les mêmes , donc évolutif mais attaché.