Ampere : NVIDIA lance huit nouvelles cartes graphiques « Pro »
Il y en a pour tous les goûts
Le 12 avril 2021 à 17h00
5 min
Hardware
Hardware
Que vous cherchiez une carte graphique simple slot à petit TDP, un modèle pour PC portable ou un petit monstre à 4 GPU pour la virtualisation dans vos datacenters, NVIDIA a une solution Ampere pour entreprises à vous proposer désormais. Le constructeur vient en effet de dévoiler 8 nouvelles cartes graphiques.
Cette édition 2021 de la GTC est chargée pour NVIDIA. Le constructeur développe son écosystème ARM, notamment dans les serveurs, et a dévoilé un nouveau CPU maison pour ce marché. Les cartes graphiques ne sont pas oubliées pour autant. Et si Ampere n'est pas (encore) remplacé, de nombreuses références ont été évoquées.
Commençons par un rappel : il n'est plus question de Quadro ou de Tesla. Ces dénominations n'ont plus lieu d'être. Ainsi, lorsqu'elle décline ses GPU Ampere avec RT et Tensor Core pour les stations de travail, la société ne les distingue que par un « A » en début de référence. Les actuelles RTX A6000 sont ainsi accompagnées désormais des A5000 et A4000. On a également droit à plusieurs déclinaisons pour serveurs et PC portables.
RTX A4000 : une presque RTX 3070 compacte et peu gourmande
Passons à la NVIDIA RTX A4000 qui exploite une puce GA104 avec 6 144 CUDA Cores, 192 Tensor Cores et 48 RT Cores. Elle est accompagnée de 16 Go de GDDR6 (ECC). Sa puissance de calcul est annoncée pour 19,2 TFLOPS (FP32). Elle est donc un peu moins performante qu'une GeForce RTX 3070 (20,3 TFLOPS) avec un GPU plus complet. Cela s'explique sans doute par une fréquence plus faible et une consommation réduite : 140 watts contre 220 watts.
Modèle « 4000 » oblige, elle n'occupe en effet qu'un emplacement PCIe avec un ventirad réduit. Elle dispose de quatre sorties vidéo DP 1.4 et ne nécessite qu'un connecteur d'alimentation PCIe à 6 broches. Côté mémoire, elle double la GeForce RTX 3070 avec 16 Go de GDDR6 (ECC), toujours sur 256 bits, soit une bande passante de 448 Go/s.
RTX A5000 : 24 Go de mémoire dans une presque RTX 3080
La RTX A5000 est un peu dans la même veine, mais se positionne juste sous la GeForce RTX 3080. Elle embarque en effet une puce GA102 avec 8 192 CUDA Cores, 256 Tensor Cores et 64 RT Cores et 27,8 TFLOPS au compteur, contre 29,8 TFLOPS pour la déclinaison grand public. Mais avec une consommation de 230 watts plutôt que 320 watts.
Ici aussi on garde les 768 Go/s de bande passante mémoire (384 bits), avec une quantité supérieure : 24 Go de GDDR6 (ECC) plutôt que 10 Go. Deux emplacements PCIe sont occupés par cette carte également dotée de quatre sorties DP 1.4. Comme la A4000, elle intègre un moteur NVENC et un NVDEC. Mais ce dernier est ici accompagné d'un second.
L'alimentation est assurée par un connecteur PCIe à 8 broches. Un connecteur NV-Link (112,5 Go/s) permet de connecter jusqu'à deux RTX A5000 ensemble. Dans les deux cas, aucun tarif n'a été précisé. La disponibilité des RTX 4000 et 5000 est attendue pour avril. Espérons qu'elle sera meilleure que celle des GeForce RTX.
Quatre déclinaisons mobiles
Comme les GeForce RTX, ces cartes pour professionnels trouvent également leur place dans les PC portables. Quatre déclinaisons sont proposées : les RTX A2000, A3000, A4000 et A5000, d'une puissance de calcul allant de 9,3 à 21,7 TFLOPS, avec 2 560 à 6 144 CUDA Cores, 4 à 16 Go de GDDR6, 35 à 165 watts de TDP (et des plages assez larges).
Leurs caractéristiques sont détaillées ci-dessous. Comme pour les PC portables du grand public, il faudra faire attention aux fréquences annoncées qui pourront changer les performances constatées du tout au tout selon le TDP visé. Notez d'ailleurs que deux « nouveaux » modèles sont également de la partie : les T600 et T1200. Comme leur nom l'indique, ils exploitent des GPU Turing et visent l'entrée de gamme avec 2,5 et 3,7 TFLOPS.
NVIDIA évoque aussi tout une évolution de ses outils côté logiciel avec une offre Omniverse Entreprise, CloudXR 2.1 sur iOS, de nombreux SDK et autres solutions de partenaires. Ses serveurs DGX évoluent d'ailleurs dans leur format et leur modèle commercial avec une offre de location mensuelle. Nous y reviendrons dans un prochain article.
NVIDIA A10 : RT et mémoire renforcés
On passe aux modèles pour serveurs, dépourvus de ventilation active. Et on commence avec l'A10 qui reprend le principe de la RTX A4000 avec un design n'occupant qu'un emplacement PCIe et un TDP de 150 watts.
Sa puissance de calcul annoncée est de 31,2 TFLOPS, mais avec une mémoire plus importante et plus rapide : 24 Go de GDDR6 et 600 Go/s de bande passante. Ce modèle est également doté de 72 RT Cores. NVIDIA la met ainsi en avant pour la virtualisation d'environnement de travail de rendu 3D, capable de gérer également calculs et IA.
Pour rappel, une A40 avait été annoncée en octobre dernier.
NVIDIA A16 : 4 GPU sur un PCB, chacun avec 16 Go de GDDR6
Le constructeur semblait également vouloir répondre aux solutions multi-GPU de ses concurrents, notamment Intel et sa carte H3C XG310 avec 4x server GPU. On trouve ici un modèle occupant deux emplacements PCIe avec un TDP de 250 watts sur lequel on sait encore peu de choses, si ce n'est qu'elle ne nécessite qu'un connecteur PCIe x16 pour fonctionner et qu'elle intègre 4 moteurs NVENC pour 8 moteurs NVDEC : l'A16.
Elle pourra donc être utilisée pour virtualiser des systèmes et applications, mais aussi traiter des vidéos en masse. Soit exactement les marchés visés par la solution d'Intel. Comme pour les autres modèles son prix n'est pas donné. Il faudra cette fois attendre le mois de mai pour les retrouver chez les différents intégrateurs partenaires de NVIDIA.
Ampere : NVIDIA lance huit nouvelles cartes graphiques « Pro »
-
RTX A4000 : une presque RTX 3070 compacte et peu gourmande
-
RTX A5000 : 24 Go de mémoire dans une presque RTX 3080
-
Quatre déclinaisons mobiles
-
NVIDIA A10 : RT et mémoire renforcés
-
NVIDIA A16 : 4 GPU sur un PCB, chacun avec 16 Go de GDDR6
Commentaires (13)
Le 12/04/2021 à 18h09
Ça se positionne comment par rapport à une A100 ?
Le 12/04/2021 à 18h52
A100 c’est 20 TFLOPS, mais pas trop le même genre de produit (format, HBM2, etc.). Ici ce sont des modèles assez spécifiques pour certains marchés (virtualisation surtout)
Le 12/04/2021 à 22h50
La plus grosse différence il me semble que c’est niveau FP64, 9,7 TFLOPS pour la A100, et même 19.5 sur les tensor cores, là où les RTX A doivent plafonner à ~1 TFLOPS si c’est comme les RTX de jeu
Le 12/04/2021 à 23h06
Oui enfin pour l’instant, il y en a plutôt pour personne, et ça dure.
Le 13/04/2021 à 09h38
et par rapport a une 3090 ? au vu de cette annonce, les prochaines titan/quadro seront sans doutes bientôt annoncés aussi…
Le 13/04/2021 à 09h40
Il n’y a plus de Titan (la RTX 3090 est là pour ça). Comme dit dans l’article, la dénomination Quadro n’est plus utilisée. Il y a déjà eu une RTX A6000 à 48 Go de GDDR6 annoncée il y a quelques mois.
Le 13/04/2021 à 10h52
Ça va être relou l’absence de dénomination quadro à l’avenir :( ça avait le mérite d’être clair…
Le 13/04/2021 à 11h31
Pas forcément, GeForce = grand public, sinon c’est du pro (avec Quadro/Tesla selon le type de référence). C’est surtout pour éviter les références à rallonge je suppose (AMD fait pareil d’ailleurs).
Le 13/04/2021 à 12h13
la A6000 & A5000 semblent avoir été cité/référencés, mais ouai niveau dispo…et compatibles nvlink apparemment.
Le 13/04/2021 à 14h19
Combien de mhs ? :-p
Le 13/04/2021 à 14h38
Vu les tarifs de ces cartes, ce ne sont pas vraiment celles qu’on vise quand on veut miner rentable ;)
Le 14/04/2021 à 06h28
Ma RX500 commandée en novembre vient d’être expédiée, tout arrive !
Il y’a quelques 3090 : https://neeed.comptoir.co/ 2500€ ! Soit 1000€ de plus que le prix officiel
Le 14/04/2021 à 17h40
Hmmm. Pour remplacer les T4 du taf, et augmenter les perfs, surtout la VRAM, faudrait s’orienter vers la A10 du coup on dirait…
La A16 permettrait-elle d’augmenter la densité dans les ESX ?
edit : Mais ca va couter bonbon, tout ça…