NVIDIA lance ses A40, RTX A6000 et veut toujours plus de place dans les serveurs

NVIDIA lance ses A40, RTX A6000 et veut toujours plus de place dans les serveurs

GPU glouton

Avatar de l'auteur

David Legrand

Publié dansHardware

05/10/2020
2
NVIDIA lance ses A40, RTX A6000 et veut toujours plus de place dans les serveurs

C'est aujourd'hui que s'ouvrent les portes (virtuelles) de l'édition 2020 de la GPU Technology Conference (GTC) de NVIDIA. Le constructeur y déploie sa stratégie de conquête progressive des serveurs, ainsi que deux nouvelles cartes : l'A40 et la RTX A6000 (ne dites plus Quadro et Tesla).

La GTC est un moment important pour NVIDIA. C'est en effet le salon où le géant de la puce graphique rencontre son écosystème, ses partenaires et les développeurs. Il peut ainsi les réunir pour parler tant de l'évolution de sa recherche que de ce que permettent ses produits. Un peu comme l'IDF à la grande époque d'Intel.

Covid-19 oblige, l'édition 2020 est dématérialisée. Toutes les conférences seront ainsi accessibles via le site de l'évènement. De quoi assurer des heures de lecture aux passionnés du secteur. Mais il y a aussi l'habituelle conférence d'ouverture de Jen Hsun Huang, où le PDG fait de nombreuses annonces. Elle vient de commencer.

Micro PC et grosses cartes graphiques

Cette année encore, NVIDIA n'y va pas avec le dos de la cuillère et multiplie les annonces. Il y a bien sûr celle qui retiendront l'attention du plus grand nombre comme le micro PC Jetson Nano 2 Go à 59 dollars ou les deux nouvelles cartes graphiques « Pro  » : l'A40 et la RTX A6000, basées sur l'architecture Ampere.

Il s'agit en réalité de produits similaires, avec un GPU A102 complet, ses 10 752 CUDA Cores, 336 Tensor Cores et 84 RT Cores. Ici, pas question de la très rapide GDDR6X, mais de pas moins de 48 Go de GDDR6 ECC. Un chiffre qui peut être doublé avec deux cartes reliées par un NVLink. Leurs GPU peuvent être virtualisés.

La première se destine aux serveurs avec un TGP limité à 300 watts et un refroidissement passif. La seconde est un modèle classique pour station de travail. Elles visent les professionnels du calcul et du rendu 3D. Leur tarif n'a pas été dévoilé. La RTX A6000 sera disponible mi-décembre. Les sytèmes intégrant ces cartes sont attendus début 2021.

NVIDIA RTX A6000 A40

NVIDIA veut continuer de faire du CPU une commodité

Cette GTC est l'occasion pour NVIDIA de montrer ses cartes concernant sa stratégie à long terme. Il est d'ailleurs intéressant de voir que dans le serveur ou le PC, les mécaniques utilisées sont similaires, avec un même objectif : minorer l'intérêt du CPU. Faire du GPU le nouvel accélérateur à tout faire.

C'est là que la notion de DPU (Data Processing Unit) entre en scène avec la gamme BlueField2. Il s'agit de fusionner une carte réseau 2x 100 Gb/s PCIe 4.0 avec un SoC contenant huit cœurs ARM A72 et des accélérateurs spécialisés. Le tout pouvant être accompagné d'un GPU Ampere et géré à distance via une interface spécialisée.

De quoi aller plus loin que les habituels Smart NIC, les différents éléments pouvant échanger directement des données et reproduire une sorte de serveur tout-en-un sous la forme d'une carte PCIe. C'est pour cela que NVIDIA parle de Data Center Infrastructure-on-a-Chip. Il dévoile aujourd'hui une couche logicielle dédiée et mise à disposition des développeurs : DOCA SDK. Mais aussi une feuille de route complète pour deux générations (jusqu'à 2023) :

  • NVIDIA Bluefield2 DOCA
  • NVIDIA Bluefield2 DOCA
  • NVIDIA Bluefield2 DOCA
  • NVIDIA Bluefield2 DOCA
  • NVIDIA Bluefield2 DOCA

Une manière de montrer que si rachat d'ARM il y a dans les 18 mois à venir, il se fera effectivement pour renforcer la compétition dans le monde des serveurs avec une capacité d'intégration à ses solutions assez poussée. Le tout favorisé par le rachat de Mellanox, devenu depuis NVIDIA Networks. Intel est prévenu.

VMWare est annoncé comme partenaire, les deux sociétés multipliant les initiatives communes (nous y reviendrons). Canonical, Red Hat et Check Point Software sont également impliquées dans l'intégration et le support de ces DPU. La Gamme Bluefield2(X) est attendue pour le courant de l'année prochaine.

De plus en plus de solutions collaboratives clé en main

Autre tendance lourde : les outils prêts à l'emploi. Comme pour les joueurs, NVIDIA ne veut pas se contenter de fournir des GPU. Il veut montrer de quoi ils sont capables, sans dépendre du bon vouloir de ses partenaires.

Il y a bien entendu la plateforme de travail collaboratif Omniverse, construite autour du format Universal Scene Description (USD) de Pixar, qui passera au stade de la bêta ouverte avant la fin de l'année. Cette étape fait suite à plus d'un an de test auprès d'une quarantaine de partenaires triés sur le volet.

Il faut également compter sur Maxine, une plateforme devant servir aux services de vidéo-conférence pour qu'ils puissent exploiter des fonctionnalités liées à l'IA. Cela va de l'annulation de bruit à l'amélioration de la définition de l'image en temps réel en passant par diverses corrections.

Pour le moment, Maxine est proposée en accès anticipé aux développeurs. Elle doit regrouper d'autres initiatives du même genre précédemment annoncées, comme Jarvis. Amazon AWS, Google Cloud, Microsoft Azure, Oracle Cloud Infrastructure et Tencent Cloud sont annoncés comme partenaires.

NVIDIA dévoile l'arrivée en bêta de la plateforme CloudXR sur les instances EC2 P3 et G4 d'Amazon AWS (GPU V100/T4), devant permettre l'accès en ligne à des solutions de réalité augmentée/virtuelle. Un SDK lui est associé.

NVIDIA Omniverse Open betaNVIDIA Maxine

Supercalcultateur Cambridge-1 et renforcement dans la santé

D'autres annonces ont été faites, comme un partenariat avec GSK qui va se fournir en serveurs DGX A100 mais aussi avoir accès au nouveau supercalculateur devant être livré en Angleterre : Cambridge-1. Il s'agit d'un DGX SuperPOD de pas moins de 8 PetaFLOPS (Linpack) et 400 TFLOPS (IA, précision non détaillée) qui serait 29e au TOP500.

Enfin, Jen Hsun Huang a mis en avant les travaux de son entreprise en matière de recherche sur le federated learning, qui consiste à entraîner des IA depuis différentes sources de données sans que les informations sensibles ne soient partagées. Des solutions déjà utilisées ici ou là pour mieux préserver la vie privée.

Clara Discovery est également officialisée, regroupant des outils existant ou nouveaux dans le monde de la santé.

NVIDIA Cambridge-1
2
Avatar de l'auteur

Écrit par David Legrand

Tiens, en parlant de ça :

Le SoC Graviton4 d’Amazon AWS posé sur une table

Amazon re:invent : SoC Graviton4 (Arm), instance R8g et Trainium2 pour l’IA

Tout plus mieux qu'avant

09:30Hardware 0
Logo Comcybergend

Guéguerre des polices dans le cyber (OFAC et ComCyberMi)

CyberCom'

09:06Sécurité 6
Mur d’OVHcloud à Roubaix, avec le logo OVHcloud

OVHcloud Summit 2023 : SecNumCloud, IA et Local Zones

Des mini datacenters… Ouais une baie quoi ?

19:03HardwareInternet 2

Sommaire de l'article

Introduction

Micro PC et grosses cartes graphiques

NVIDIA veut continuer de faire du CPU une commodité

De plus en plus de solutions collaboratives clé en main

Supercalcultateur Cambridge-1 et renforcement dans la santé

Le SoC Graviton4 d’Amazon AWS posé sur une table

Amazon re:invent : SoC Graviton4 (Arm), instance R8g et Trainium2 pour l’IA

Hardware 0
Logo Comcybergend

Guéguerre des polices dans le cyber (OFAC et ComCyberMi)

Sécurité 6

#LeBrief : faille 0-day dans Chrome, smartphones à Hong Kong, 25 ans de la Dreamcast

0
Mur d’OVHcloud à Roubaix, avec le logo OVHcloud

OVHcloud Summit 2023 : SecNumCloud, IA et Local Zones

HardwareInternet 2
algorithmes de la CAF

Transparence, discriminations : les questions soulevées par l’algorithme de la CAF

IA et algorithmesSociété numérique 48

Plainte contre l’alternative paiement ou publicité comportementale de Meta

DroitIA et algorithmes 18
Nuage (pour le cloud) avec de la foudre

Économie de la donnée et services de cloud : l’Arcep renforce ses troupes

DroitInternet 0
De vieux ciseaux posés sur une surface en bois

Plus de 60 % des demandes de suppression reçues par Google émanent de Russie

Société numérique 4
Une vieille boussole posée sur un plan en bois

La Commission européenne et Google proposent deux bases de données de fact-checks

DroitInternet 3

#LeBrief : des fichiers Google Drive disparaissent, FreeBSD 14, caméras camouflées, OnePlus 12

0

Le poing Dev – round 6

Next 142

Produits dangereux sur le web : nouvelles obligations en vue pour les marketplaces

Droit 7
consommation de l'ia

Usages et frugalité : quelle place pour les IA dans la société de demain ?

IA et algorithmes 12

La NASA établit une liaison laser à 16 millions de km, les essais continuent

Sciences et espace 17
Concept de CPU

Semi-conducteurs : un important accord entre l’Europe et l’Inde

Hardware 6

#LeBrief : PS5 Slim en France, Valeo porte plainte contre NVIDIA, pertes publicitaires X/Twitter

0
Un mélange entre une réunion d’Anonymous et de tête d’ampoules, pour le meilleur et le pire

651e édition des LIDD : Liens Intelligents Du Dimanche

Internet 30
Bannière de Flock avec des bomes sur un fond rouge

#Flock, le grand remplacement par les intelligences artificielles

Flock 34
Un Sébastien transformé en lapin par Flock pour imiter le Quoi de neuf Docteur des Looney Tunes

Quoi de neuf à la rédac’ #9 : LeBrief 2.0, ligne édito, dossiers de fond

Next 64
Pilule rouge et bleue avec des messages codés

Encapsulation de clés et chiffrement d’enveloppes

Sécurité 31
Empreinte digital sur une capteur

Empreintes digitales : les capteurs Windows Hello loin d’être exemplaires

Sécurité 20

#LeBrief : succès du test d’Ariane 6, réparer plutôt que remplacer, Broadcom finalise le rachat de VMware

0

Hébergeurs, éditeurs, espaces de conversation ? La difficile régulation des réseaux sociaux

Réseaux sociauxSociété numérique 23
Puces en silicium

Silicium : un matériau indispensable et omniprésent, mais critique

HardwareSciences et espace 25
Panneau solaire bi-face Sunology Play

Panneaux solaires en autoconsommation : on décortique le kit Play de Sunology

Hardware 27
The eyes and ears of the army, Fort Dix, N.J.

Un think tank propose d’autoriser les opérations de « hack back »

Sécurité 13

#LeBrief : Ariane 6 sur le banc de test, arrestation algorithmique, entraînement d’IA par des mineurs

0
Logo de Google sur un ordinateur portable

Chrome : Google corrige plusieurs failles sévères, dont une déjà exploitée

Logiciel 0

vieux téléphones portables

Des cadres supérieurs invités à n’utiliser que des téléphones jetables à Hong Kong

Sécurité 15

La Dreamcast de Sega fête ses 25 ans

Hardware 13

Pilule rouge et bleue avec des messages codés

Démantèlement d’un groupe ukrainien de rançongiciels

Sécurité 3

Commentaires (2)


Arona Abonné
Il y a 3 ans

48Go de RAM c’est surement 4.8x plus puissant qu’une 3080! :lapin:


David_L Abonné
Il y a 3 ans

Ce serait vrai, la Quadro RTX 8000 le serait déjà :D