Lors du lancement de sa série Super, NVIDIA indiquait que sa RTX 4070 Super disposait de 21,7 % de Cuda Cores supplémentaire, toujours avec un GPU AD104. La fiche technique précisait aussi 36 Mo de cache L2, exactement comme sur la RTX 4070 de base.
C’était en fait une erreur que NVIDIA a corrigée. Désormais, la fiche technique indique que la carte dispose de 48 Mo de cache L2. La RTX 4070 Super sera disponible à partir du 17 janvier pour 659 euros.
Commentaires (4)
#1
Pour le tester (open source en plus) c'est assez simple, sur un petit modèle c'est un monstre, ça promet ! :
--
curl https://ollama.ai/install.sh | sh
ollama run mistral
--
ou
--
ollama run mixtral
--
La dernière commande lance Mixtral-8x7B, le llm le plus efficace actuellement, mais gourmand en ram. Une dinguerie, à mi chemin entre GPT 3.5 et GPT4 avant qu'il ne soit bridé par le politiquement correct, mais nécessitant beaucoup beaucoup moins de ressources matérielles, avec un nombre de tokens générés permettant de faire du multi-utilisateurs...
Il y a même un mode compatibilité sur CPU en cas d'absence de GPU Nvidia, pour pouvoir tester malgré tout.
https://mistral.ai
#1.1
#1.2
En revanche, vaut mieux utiliser la verison Python, ou le docker ? car bon, docker sous windows... -_-
#1.3
https://iv.melmac.space/watch?v=mc2Qli9ImOI