GeForce RTX 40 Super

La GeForce RTX 4070 Super dispose de 48 Mo de cache L2

GeForce RTX 40 Super

Lors du lancement de sa série Super, NVIDIA indiquait que sa RTX 4070 Super disposait de 21,7 % de Cuda Cores supplémentaire, toujours avec un GPU AD104. La fiche technique précisait aussi 36 Mo de cache L2, exactement comme sur la RTX 4070 de base.

C’était en fait une erreur que NVIDIA a corrigée. Désormais, la fiche technique indique que la carte dispose de 48 Mo de cache L2. La RTX 4070 Super sera disponible à partir du 17 janvier pour 659 euros.

Commentaires (4)


Est ce que ce genre de GPU serait suffisant pour faire tourner en local Mistral AI avec de bonnes performances ? :D :fr:

Pour le tester (open source en plus) c'est assez simple, sur un petit modèle c'est un monstre, ça promet ! :

--
curl https://ollama.ai/install.sh | sh
ollama run mistral
--
ou
--
ollama run mixtral
--
La dernière commande lance Mixtral-8x7B, le llm le plus efficace actuellement, mais gourmand en ram. Une dinguerie, à mi chemin entre GPT 3.5 et GPT4 avant qu'il ne soit bridé par le politiquement correct, mais nécessitant beaucoup beaucoup moins de ressources matérielles, avec un nombre de tokens générés permettant de faire du multi-utilisateurs...

Il y a même un mode compatibilité sur CPU en cas d'absence de GPU Nvidia, pour pouvoir tester malgré tout.

https://mistral.ai
Modifié le 15/01/2024 à 09h26
J'ai testé mixtral, il tourne sur une 3060 avec 12 Go de ram, donc ça devrait tourner sur la 4070 super vu qu'elle a 12 Go aussi. Mixtral consomme 11,06 Go sur ma carte graphique. Donc c'est limite mais ça tourne
Tiens, je vais tester cela avec ma 4080 :o

En revanche, vaut mieux utiliser la verison Python, ou le docker ? car bon, docker sous windows... -_-
Underscore_ en a fait un bon résumé hier pour ceux qui veulent en savoir plus:
https://iv.melmac.space/watch?v=mc2Qli9ImOI
Modifié le 15/01/2024 à 19h20
Fermer