NVIDIA : Après Kepler viendra Maxwell, puis la génération Volta

Parés pour la suite ?

Publié dans

19/03/2013 3 minutes

NVIDIA : Après Kepler viendra Maxwell, puis la génération Volta

Durant sa Keynote d'ouverture de la GTC 2013, Jen Hsun Huang a décidé de lever le voile sur la roadmap des GPU à venir de la société. Si l'on avait déjà entendu parler du remplaçant de Kepler, Maxwell, on apprend qu'il sera ensuite question de Volta.

Durant sa Keynote d'ouverture, Jen Hsun Huang a fait la part belle aux usages autour de ses GPU au sein des applications scientifiques, mais aussi dans des usages aussi divers que le fait de retrouver des vêtements sur des sites de vente en ligne depuis la capture d'une photo issue d'un catalogue papier, Shazam ou l'analyse de tweets en masse... mais aussi le rendu d'océan ou de visage via Face Works, une démonstration d'ailleurs plutôt impressionnante.

Quelques démos, mais aussi des informations sur les GPU à venir

Il a ensuite été question de la roadmap GPU de la société afin d'évoquer la suite de Kepler. Il devrait tout d'abord être question de Maxwell, dont nous avons déjà entendu parler. Cette génération sera l'occasion d'intégrer une mémoire unifiée virtuelle qui pourra être partagée entre le CPU et le GPU. Le ratio performance / watts devrait être doublé, comme pour la génération suivante.

Car c'est la suite qui nous intéressait surtout : Volta. Cette fois, la grande nouveauté sera l'arrivée de « Stacked DRAM » qui prendra place au sein même de la puce. Une technologie déjà évoquée comme des pistes de recherche par la concurrence, dont Intel. Dans les deux cas, ce sont des avantages nets pour le calcul et CUDA qui sont visés. Reste à voir ce qu'il en sera du côté du jeu.

GRID fait son retour, pour le contrôle de VM à distance dans les entreprises

NVIDIA en a profité pour reparler de sa solution GRID VCA (Visual Computing Appliance), qui est un serveur complet (4U) composé de deux processeurs Xeon à huit coeurs, de 384 Go de mémoire et de huit cartes graphiques GRID (basés sur deux GPU Kepler) afin de supporter des machines virtuelles accessibles à distance.

Une démonstration a été effectuée sous OS X avec trois « workspaces » permettant chacun d'effectuer un calcul sur des applications nécessitant beaucoup de ressource sans que la machine locale ne soit sollicitée. Une manière aussi d'éviter les soucis concernant les données pouvant être volées sur un client utilisé par les employés des entreprises.

Mais il est désormais temps de passer à la phase commerciale. Ainsi, deux versions sont proposées avec plus ou moins de mémoire, de CPU, de GPU... l'ensemble est livré de manière complète avec une partie logicielle GRID VGX ce qui permet à NVIDIA d'indiquer un tarif annuel dont il faudra s'acquitter en plus des 25 000 à 40 000 $ d'achat de matériel.

Commentaires (43)

Supernaz

Le 19/03/2013 à 17h 33

La roadmap en 2010

La roadmap en 2013

Maxwell n’est plus entre 14 et 16 GFlops/W mais entre 8 et 16. Ba tiens…

fma16

Le 19/03/2013 à 17h 35

Pas plus d’information sur cette “Stacked DRAM “? Non, parce que plus abstrait je vois pas trop " />" />

kaito_kid Abonné

Le 19/03/2013 à 17h 36

Supernaz a écrit :

Maxwell n’est plus entre 14 et 16 GFlops/W mais entre 8 et 16. Ba tiens…

en l’occurrence, elle est toujours entre 14 et 16 ^^

c’est juste pas la même échelle :p (plus pratique de prendre une échelle exponentielle pour ajouter volta à la roadmap ^^)

vampire7

Le 19/03/2013 à 17h 37

Pourquoi ils ont choisi un gars aussi moche pour le rendu du visage ? Ca ne donne pas envie… " />

Just1_ Abonné

Le rendu du visage est assez impressionnant " />

metaphore54

Le 19/03/2013 à 17h 38

viendra Maxwell

Il fera du café ? " />

Maxwell Qualité Filtre : Café soluble lyopilisé

kamuisuki

Le 19/03/2013 à 17h 40

Le rendu est bon, c’est réaliste, c’est bien = )

Skyforger

Le 19/03/2013 à 17h 45

Fermi, c’est fini…

Aloyse57

Le 19/03/2013 à 17h 46

J’ai une question bien stupide à propos de CUDA. De nombreux programmes, notamment les encodeurs vidéo mettent en avant l’utilisation de cette technologie.

J’ai testé chez moi de VOB à MP4/H624 et je n’ai aucune différence notable entre encodage logiciel (CPU) et CUDA. Dès fois, c’est même moins bien en CUDA.

Testé avec plusieurs logiciels sur 2 configs différentes (Quad6600+8800GTS, Corei7-3770K/Geforce680). Donc, je ne comprends pas bien l’intérêt de CUDA.

Alpha Centauri

Le 19/03/2013 à 17h 47

#10

metaphore54 a écrit :

Il fera du café ? " />

Maxwell Qualité Filtre : Café soluble lyopilisé

Et Volta fera office de batterie " />

Fu2chN

Le 19/03/2013 à 17h 48

#11

Moi entre un i7 2600k et une GTX560 TI ou 660 je la vois bien la différence. 4x pour l’i7 contre 12x pour la GTX.

Reparateur

Le 19/03/2013 à 17h 59

#12

ont pourrais avoir plus d’explication sur ma mémoire unifié ?

Le 19/03/2013 à 18h 00

#13

Reparateur a écrit :

ont pourrais avoir plus d’explication sur ma mémoire unifié ?

Certainement comme se qu’il se fait sur console.

David_L Abonné

Le 19/03/2013 à 18h 01

#14

Reparateur a écrit :

ont pourrais avoir plus d’explication sur ma mémoire unifié ?

Du genre ?

Le 19/03/2013 à 18h 04

#15

David_L a écrit :

Du genre ?

Se que sa apporte ?

Le 19/03/2013 à 18h 05

#16

GrosRaisin a écrit :

Se que sa apporte ?

L’accès aux données mémoire du GPU depuis une application qui tourne sur le CPU et inversement ?

John Shaft Abonné

Le 19/03/2013 à 18h 06

#17

metaphore54 a écrit :

Il fera du café ? " />

Maxwell Qualité Filtre : Café soluble lyopilisé

Je te donne Carte Noire pour la gestion de la comm’ autour de Maxwell ! " />" />

Tkop

Le 19/03/2013 à 18h 08

#18

David_L a écrit :

L’accès aux données mémoire du GPU depuis une application qui tourne sur le CPU et inversement ?

Le concepte de la memoire unifié on a compris: elle est adressable par le CPU et le GPU en mème temps;

La question c’est plutôt: techniquement comment c’est implémenté ?

La mémoire est sur la CM, sur la CG?

accès est il symétrique entre CPU et GPU?

Quel débit ?

Quelle latence ?

Interchangeable ?

Faut -il une CM spéciale ?

…

#19

Edit: double ?

Seth-01

Le 19/03/2013 à 18h 09

#20

Ahhh ben tient …. la démo du visage ne semble pas prendre en compte TressFX …. il est chauve !! " />

xillibit Abonné

#21

Reparateur a écrit :

ont pourrais avoir plus d’explication sur ma mémoire unifié ?

ta mémoire unifié ? c’est un implant au niveau de ton cerveau

Le 19/03/2013 à 18h 13

#22

David_L a écrit :

Du genre ?

Genre des phrases choc.

#23

Tkop a écrit :

Le concepte de la memoire unifié on a compris: elle est adressable par le CPU et le GPU en mème temps;

La question c’est plutôt: techniquement comment c’est implémenté ?

La mémoire est sur la CM, sur la CG?

accès est il symétrique entre CPU et GPU?

Quel débit ?

Quelle latence ?

Interchangeable ?

Faut -il une CM spéciale ?

…

Bah la mémoire est sur la CG, je ne vois pas pourquoi il faudrait une carte mère spéciale. On est dans l’univers PC là ;)

Pour le reste, il faudra surement attendre d’en savoir plus sur l’architecture et les évolutions de CUDA, mais l’adressage CPU / GPU unifié est déjà implémenté et détaillé dans ce genre de docs chez NV (UVA) :

http://developer.download.nvidia.com/CUDA/training/cuda_webinars_GPUDirect_uva.p…

Le 19/03/2013 à 18h 20

#24

David_L a écrit :

Bah la mémoire est sur la CG, je ne vois pas pourquoi il faudrait une carte mère spéciale. On est dans l’univers PC là ;)

Pour le reste, il faudra surement attendre d’en savoir plus sur l’architecture et les évolutions de CUDA, mais l’adressage CPU / GPU unifié est déjà implémenté et détaillé dans ce genre de docs chez NV (UVA) :

http://developer.download.nvidia.com/CUDA/training/cuda_webinars_GPUDirect_uva.p…

J’ai pas tout saisis mais j’ai l’impression que ce n’est pas une unification matérielle de la mémoire ( la mémoire de la CG ne va pas s’ajouter à la mémoire CPU dans l’OS) mais une unification de l’adressage pour faciliter la programmation des transferts de données dans CUDA (quid de la répercution dans OpenCL?) et éventuellement éviter la redondance des données entre les GPU

dede36

Le 19/03/2013 à 18h 21

#25

Supernaz a écrit :

Genre des phrases choc.

" />

tAran

Le 19/03/2013 à 18h 25

#26

La prochaine prochaine génération s’appellera Herta.. ou pas " />

sniperdc

Le 19/03/2013 à 18h 39

#27

Just1_ a écrit :

Le rendu du visage est assez impressionnant " />

+1

J’espère qu’il ne faut pas un Sli Tri Way de Maxwell pour avoir ce redu à 12 fps " />

belgeek

Le 19/03/2013 à 19h 01

#28

fma16 a écrit :

Pas plus d’information sur cette “Stacked DRAM “? Non, parce que plus abstrait je vois pas trop " />" />

D’après la news sur Engadget, il y aura un “silica substrate” entre le GPU et la mémoire. Ensuite grâce via un trou dans le silicone ils feront le plus de connexions possibles.

Enfin, je vous laisse lire en anglais parce que traduire ça c’est pas facile " />

Skeeder

Le 19/03/2013 à 19h 22

#29

Tkop a écrit :

J’ai pas tout saisis mais j’ai l’impression que ce n’est pas une unification matérielle de la mémoire ( la mémoire de la CG ne va pas s’ajouter à la mémoire CPU dans l’OS) mais une unification de l’adressage pour faciliter la programmation des transferts de données dans CUDA (quid de la répercution dans OpenCL?) et éventuellement éviter la redondance des données entre les GPU

Moi je l’ai compris comme un “NUMA” géant qui s’applique sur CPU et GPU.

yeagermach1

Le 19/03/2013 à 19h 23

#30

Tkop a écrit :

Le concepte de la memoire unifié on a compris: elle est adressable par le CPU et le GPU en mème temps;

La question c’est plutôt: techniquement comment c’est implémenté ?

La mémoire est sur la CM, sur la CG?

accès est il symétrique entre CPU et GPU?

Quel débit ?

Quelle latence ?

Interchangeable ?

Faut -il une CM spéciale ?

…

memoire sur la cg

le debit memoire vers CM sera celui du PCI express au mieux.

donc acces asymetrique

Enfin ca c’est si il reste dans le format actuel des cartes graphiques. Ou serait l’interet de se mettre a faire des CM pour nvidia ?

Le 19/03/2013 à 19h 25

#31

Skeeder a écrit :

Moi je l’ai compris comme un “NUMA” géant qui s’applique sur CPU et GPU.

Ouai mais je ne suis pas certain que l’on puisse accéder à la mémoire GPU en dehors de l’API cuda

Le 19/03/2013 à 19h 26

#32

Tkop a écrit :

J’ai pas tout saisis mais j’ai l’impression que ce n’est pas une unification matérielle de la mémoire ( la mémoire de la CG ne va pas s’ajouter à la mémoire CPU dans l’OS) mais une unification de l’adressage pour faciliter la programmation des transferts de données dans CUDA (quid de la répercution dans OpenCL?) et éventuellement éviter la redondance des données entre les GPU

L’os pourra l’utiliser si l’OS utilise Cuda. Apres on peut parier que cela va arriver rapidement dans une evolution de directX. OpenCl est exclu de cela pour l’instant sauf si nvidia l’implemente ou si opencl decide de s’y mettre aussi.

#33

yeagermach1 a écrit :

memoire sur la cg

le debit memoire vers CM sera celui du PCI express au mieux.

donc acces asymetrique

Enfin ca c’est si il reste dans le format actuel des cartes graphiques. Ou serait l’interet de se mettre a faire des CM pour nvidia ?

Perso quand tu me parle de RAM CPU/GPU unifié je pense à la Xbox 360 ou à la ps4 … et aussi les IGP " />

Le 19/03/2013 à 19h 30

#34

Tkop a écrit :

Perso quand tu me parle de RAM CPU/GPU unifié je pense à la Xbox 360 ou à la ps4 … et aussi les IGP " />

Cela en vient surement pour le grand public. Mais on reste sur une config PC comme le dit le monsieur en rouge au dessus. A part changer complétement le paradigme de base, je ne vois pas comment changer cela.

Je veux dire, si tu la met sur la CM, c’est le GPU qui sera désavantagé parce que l’accès a la mémoire passera par le PCI-E. Si tu la met sur le GPU, cela sera le CPU qui sera désavantagé pour la même raison.

Je vois que deux solutions a cela :

un IGP mais nvidia ne fait pas de x86.

un nouveau port ultra performant mais on en aurait deja entendu parler (juste par les travaux de normification nécessaire a cela).

ArthurG

Le 19/03/2013 à 19h 33

#35

Oubliez pas que Maxwell integre project Denver, le CPU ARM 64 bits custom de chez Nvidia (Tegra 6, Parker, a la meme archi).

Donc AMHA, virtual memory, en conjonction avec CUDA, va permettre d’effectuer tous les calculs sur la carte graphique, le(s) core(s) ARM prendront en charge les operations logiques, et les cores CUDA les operations massivement paralleles. En evitant les vas et vients du bus PCI avec le CPU x86, ca va booster les perfs.

Volta, et son TB/s de bande passante, sera encore plus interessant.

Finalement Boulder sera l’aboutissement, un SoC haute performance en ARM 64bits qui n’aura plus besoin de CPU c86 pour fonctionner. Nvidia sans Intel quoi.

Le 19/03/2013 à 19h 38

#36

yeagermach1 a écrit :

Cela en vient surement pour le grand public. Mais on reste sur une config PC comme le dit le monsieur en rouge au dessus. A part changer complétement le paradigme de base, je ne vois pas comment changer cela.

Pendant longtemps il fallait des carte mère spéciale pour profiter du multi-GPU, d’abord des cm avec les chipset des constructeurs puis ensuite seulement des puce additionnelle.

Une carte mère avec un gestion spécifique de la ram pour le monde du calcul je ne trouve pas ça exceptionnel surtout que quand tu change ce genre de machine t’as tendance à tout changer et pas changer pièce par pièce .

Mais je pense que t’as raison.

amFXR0

Le 19/03/2013 à 19h 56

#37

fma16 a écrit :

Pas plus d’information sur cette “Stacked DRAM “? Non, parce que plus abstrait je vois pas trop " />" />

En faite c’est une évolution dans la manière de fabriquer les puces de mémoires : actuellement on atteint une limite de la taille des puces de mémoires possibles : limite de taille physique.

Pour parler plus clairement : plus de cases mémoires (et donc de capacité) peut se faire par deux moyens :

Augmenter la densité (et donc diminuer la taille des cases mémoires) : c’est ce que l’on fait depuis longtemps, mais il devient de plus en plus difficile de continuer efficacement.

Mettre plus de cases mémoires : ce que l’on fait aussi, mais la il y a une limite physique : celle de la vitesse des électrons. Plus la puce mémoire est grande en taille, moins on peut augmenter la fréquence : les cases les plus éloignées mettent plus de temps à répondre.

La solution c’est celle des gratte-ciels !

Au lieu de mettre les étages à cotés des autres, on les empile ! On fait une couches de X cellules mémoires, puis une autre au dessus, puis ainsi de suite. En pensant en 3D on réduit le chemin à faire pour aller au cellules les plus éloignées (pour une quantité égale).

Néanmoins cette technologie demande encore un certain nombre de perfectionnements, surtout pour la mémoire graphique.

killer63

Le 19/03/2013 à 20h 37

#38

maxwell : qualité filtre ?

volta ? vivolta ?

ArthurG a écrit :

Oubliez pas que Maxwell integre project Denver,

denver, le dernier dinosaure ?

bon ok je sors , je suis fatigué " />

Lazare

Le 20/03/2013 à 07h 01

#39

Reparateur a écrit :

ont pourrais avoir plus d’explication sur ma mémoire unifié ?

http://mrelusive.com/publications/presentations/2012_siggraph/Virtual_Texturing_…

xxSeize

Le 20/03/2013 à 07h 52

#40

Perso je me fiche un peu de ce calendrier, tout ce que je sais c’est que les GTX au premier digit pair sont des cartes tests, et que les cartes qui les succède sont des révisions plus performantes et moins gourmande.

Si tant est que je reste chez Nvidia vu comment les soucis avec Tomb Raider sont gérés. C’est une honte de leur part.

divide

Le 20/03/2013 à 08h 20

#41

Mettre seulement un screenshot de la demo visage dans l’article, c’est passer à coté de 95% de la démo qui cible l’animation du visage et non le rendu… Ce rendu on l’avait deja 2 générations de GPU avant hein, pas la peine de s’extasier sur l’image.

Plus de détails (et la video surtout) ici:http://blogs.nvidia.com/2013/03/a-demo-thats-truly-a-head-of-its-time/

Le 20/03/2013 à 08h 40

#42

Tkop a écrit :

Le concepte de la memoire unifié on a compris: elle est adressable par le CPU et le GPU en mème temps;

La question c’est plutôt: techniquement comment c’est implémenté ?

La mémoire est sur la CM, sur la CG?

accès est il symétrique entre CPU et GPU?

Quel débit ?

Quelle latence ?

Interchangeable ?

Faut -il une CM spéciale ?

…

voilà

levhieu

Le 20/03/2013 à 09h 23

#43

belgeek a écrit :

D’après la news sur Engadget, il y aura un “silica substrate” entre le GPU et la mémoire. Ensuite grâce via un trou dans le silicone ils feront le plus de connexions possibles.

Enfin, je vous laisse lire en anglais parce que traduire ça c’est pas facile " />

Alors je commence un tout petit peu:

l’ anglais “silicone” == le français “silicium”

NVIDIA : Après Kepler viendra Maxwell, puis la génération Volta

Parés pour la suite ?

Quelques démos, mais aussi des informations sur les GPU à venir

GRID fait son retour, pour le contrôle de VM à distance dans les entreprises

Tiens, en parlant de ça :

#Flock fait son cinéma

Huahu ahu ouin ouin ouiiin... Vous l'avez ?

Le fichier des empreintes digitales sera interconnecté avec huit autres fichiers

FAED y verse

Le ciblage publicitaire ne peut pas utiliser des données personnelles récupérées ailleurs

Schrems vs Meta, encore et encore

Sommaire de l'article

Introduction

Quelques démos, mais aussi des informations sur les GPU à venir

#Flock fait son cinéma

Le fichier des empreintes digitales sera interconnecté avec huit autres fichiers

Le ciblage publicitaire ne peut pas utiliser des données personnelles récupérées ailleurs

Windows 11 ajoute des publicités dans le menu Démarrer, comment les supprimer

Reddit : cas d’école de la pollution par les contenus générés par IA ?

Transhumanisme, long-termisme… comment les courants « TESCREAL » influent sur le développement de l’IA

Qualcomm dévoile son Snapdragon X Plus et trois variantes du modèle Elite

Transhumanisme, long-termisme… des idéologies aux racines eugénistes ?

Corrigée depuis deux ans, une faille Windows activement exploitée par des pirates russes

La CNIL fait le bilan de son année 2023, cinquième année après RGPD

#LeBrief : TikTok suspend sa version Lite, Ariane 6 debout, enquête sur Pegasus, l’Europe et la violence numérique aux femmes

Terrorgram, la fabrique de terroristes d’extrême-droite, à coups de mèmes et de shitposts

Fiabilité des disques durs HAMR de 30 To et plus : Seagate donne des chiffres

[Màj] Le Congrès des États-Unis vote la loi obligeant ByteDance à vendre TikTok

#LeBrief : Fedora 40, anniversaire Hubble, vidéosurveillance algorithmique à Cannes, Voyager 1, Android 15 bêta 1.1

Sur GitHub et GitLab, des commentaires détournés pour stocker des malwares

[FAQ] Notre antisèche sur l’informatique quantique

L’Université d’Oxford ferme le Future of Humanity Institute dirigé par Nick Bostrom

#LeBrief : Apple rachète le français Datakalab (IA), propagande de la Russie, fin de partie pour Roccat, Proton Mail vs dark web

Europol milite pour un chiffrement de bout en bout « flexible »

Inclusion dans la tech : critiqué, le CEO de Qovery menace une internaute de poursuites

L’extension des prestataires américains devant collaborer avec la NSA fait polémique

#LeBrief : fuite chez Speedy, Rust pour Thunderbird, Saint Exupéry et PhiFire AI pour le satellite Φsat-2

Des institutions internationales s’engagent pour l’ouverture des données sur la recherche

Commentaires (43)