NVIDIA lance ses A40, RTX A6000 et veut toujours plus de place dans les serveurs
GPU glouton
Le 05 octobre 2020 à 13h00
6 min
Hardware
Hardware
C'est aujourd'hui que s'ouvrent les portes (virtuelles) de l'édition 2020 de la GPU Technology Conference (GTC) de NVIDIA. Le constructeur y déploie sa stratégie de conquête progressive des serveurs, ainsi que deux nouvelles cartes : l'A40 et la RTX A6000 (ne dites plus Quadro et Tesla).
La GTC est un moment important pour NVIDIA. C'est en effet le salon où le géant de la puce graphique rencontre son écosystème, ses partenaires et les développeurs. Il peut ainsi les réunir pour parler tant de l'évolution de sa recherche que de ce que permettent ses produits. Un peu comme l'IDF à la grande époque d'Intel.
Covid-19 oblige, l'édition 2020 est dématérialisée. Toutes les conférences seront ainsi accessibles via le site de l'évènement. De quoi assurer des heures de lecture aux passionnés du secteur. Mais il y a aussi l'habituelle conférence d'ouverture de Jen Hsun Huang, où le PDG fait de nombreuses annonces. Elle vient de commencer.
Micro PC et grosses cartes graphiques
Cette année encore, NVIDIA n'y va pas avec le dos de la cuillère et multiplie les annonces. Il y a bien sûr celle qui retiendront l'attention du plus grand nombre comme le micro PC Jetson Nano 2 Go à 59 dollars ou les deux nouvelles cartes graphiques « Pro » : l'A40 et la RTX A6000, basées sur l'architecture Ampere.
Il s'agit en réalité de produits similaires, avec un GPU A102 complet, ses 10 752 CUDA Cores, 336 Tensor Cores et 84 RT Cores. Ici, pas question de la très rapide GDDR6X, mais de pas moins de 48 Go de GDDR6 ECC. Un chiffre qui peut être doublé avec deux cartes reliées par un NVLink. Leurs GPU peuvent être virtualisés.
La première se destine aux serveurs avec un TGP limité à 300 watts et un refroidissement passif. La seconde est un modèle classique pour station de travail. Elles visent les professionnels du calcul et du rendu 3D. Leur tarif n'a pas été dévoilé. La RTX A6000 sera disponible mi-décembre. Les sytèmes intégrant ces cartes sont attendus début 2021.
NVIDIA veut continuer de faire du CPU une commodité
Cette GTC est l'occasion pour NVIDIA de montrer ses cartes concernant sa stratégie à long terme. Il est d'ailleurs intéressant de voir que dans le serveur ou le PC, les mécaniques utilisées sont similaires, avec un même objectif : minorer l'intérêt du CPU. Faire du GPU le nouvel accélérateur à tout faire.
C'est là que la notion de DPU (Data Processing Unit) entre en scène avec la gamme BlueField2. Il s'agit de fusionner une carte réseau 2x 100 Gb/s PCIe 4.0 avec un SoC contenant huit cœurs ARM A72 et des accélérateurs spécialisés. Le tout pouvant être accompagné d'un GPU Ampere et géré à distance via une interface spécialisée.
De quoi aller plus loin que les habituels Smart NIC, les différents éléments pouvant échanger directement des données et reproduire une sorte de serveur tout-en-un sous la forme d'une carte PCIe. C'est pour cela que NVIDIA parle de Data Center Infrastructure-on-a-Chip. Il dévoile aujourd'hui une couche logicielle dédiée et mise à disposition des développeurs : DOCA SDK. Mais aussi une feuille de route complète pour deux générations (jusqu'à 2023) :
Une manière de montrer que si rachat d'ARM il y a dans les 18 mois à venir, il se fera effectivement pour renforcer la compétition dans le monde des serveurs avec une capacité d'intégration à ses solutions assez poussée. Le tout favorisé par le rachat de Mellanox, devenu depuis NVIDIA Networks. Intel est prévenu.
VMWare est annoncé comme partenaire, les deux sociétés multipliant les initiatives communes (nous y reviendrons). Canonical, Red Hat et Check Point Software sont également impliquées dans l'intégration et le support de ces DPU. La Gamme Bluefield2(X) est attendue pour le courant de l'année prochaine.
De plus en plus de solutions collaboratives clé en main
Autre tendance lourde : les outils prêts à l'emploi. Comme pour les joueurs, NVIDIA ne veut pas se contenter de fournir des GPU. Il veut montrer de quoi ils sont capables, sans dépendre du bon vouloir de ses partenaires.
Il y a bien entendu la plateforme de travail collaboratif Omniverse, construite autour du format Universal Scene Description (USD) de Pixar, qui passera au stade de la bêta ouverte avant la fin de l'année. Cette étape fait suite à plus d'un an de test auprès d'une quarantaine de partenaires triés sur le volet.
Il faut également compter sur Maxine, une plateforme devant servir aux services de vidéo-conférence pour qu'ils puissent exploiter des fonctionnalités liées à l'IA. Cela va de l'annulation de bruit à l'amélioration de la définition de l'image en temps réel en passant par diverses corrections.
Pour le moment, Maxine est proposée en accès anticipé aux développeurs. Elle doit regrouper d'autres initiatives du même genre précédemment annoncées, comme Jarvis. Amazon AWS, Google Cloud, Microsoft Azure, Oracle Cloud Infrastructure et Tencent Cloud sont annoncés comme partenaires.
NVIDIA dévoile l'arrivée en bêta de la plateforme CloudXR sur les instances EC2 P3 et G4 d'Amazon AWS (GPU V100/T4), devant permettre l'accès en ligne à des solutions de réalité augmentée/virtuelle. Un SDK lui est associé.
Supercalcultateur Cambridge-1 et renforcement dans la santé
D'autres annonces ont été faites, comme un partenariat avec GSK qui va se fournir en serveurs DGX A100 mais aussi avoir accès au nouveau supercalculateur devant être livré en Angleterre : Cambridge-1. Il s'agit d'un DGX SuperPOD de pas moins de 8 PetaFLOPS (Linpack) et 400 TFLOPS (IA, précision non détaillée) qui serait 29e au TOP500.
Enfin, Jen Hsun Huang a mis en avant les travaux de son entreprise en matière de recherche sur le federated learning, qui consiste à entraîner des IA depuis différentes sources de données sans que les informations sensibles ne soient partagées. Des solutions déjà utilisées ici ou là pour mieux préserver la vie privée.
Clara Discovery est également officialisée, regroupant des outils existant ou nouveaux dans le monde de la santé.
NVIDIA lance ses A40, RTX A6000 et veut toujours plus de place dans les serveurs
-
Micro PC et grosses cartes graphiques
-
NVIDIA veut continuer de faire du CPU une commodité
-
De plus en plus de solutions collaboratives clé en main
-
Supercalcultateur Cambridge-1 et renforcement dans la santé
Commentaires (2)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 06/10/2020 à 06h56
48Go de RAM c’est surement 4.8x plus puissant qu’une 3080!
Le 06/10/2020 à 07h19
Ce serait vrai, la Quadro RTX 8000 le serait déjà