TurboQuant veut réduire grandement les besoins en mémoire des IA génératives… et ça marche
On en revient toujours à Shannon
Illustration : Flock
Le 27 mars à 11h39
Des chercheurs de Google ont publié un ensemble d’algorithmes de quantification, nommé TurboQuant. Ils permettent une compression massive réduisant l’utilisation de la mémoire, notamment pour l’IA générative, alors que le prix de la RAM est dans toutes les têtes.
TurboQuant veut réduire grandement les besoins en mémoire des IA génératives… et ça marche
On en revient toujours à Shannon
Illustration : Flock
Des chercheurs de Google ont publié un ensemble d’algorithmes de quantification, nommé TurboQuant. Ils permettent une compression massive réduisant l’utilisation de la mémoire, notamment pour l’IA générative, alors que le prix de la RAM est dans toutes les têtes.
Le 27 mars à 11h39
IA et algorithmes
IA
6 min
Le nombre de paramètres et la taille de la fenêtre contextuelle des modèles de langage (LLM) prennent une place de plus en plus importante dans leur utilisation, notamment pour traiter des quantités énormes de documents et leur permettre d’augmenter leur acuité. Mais son utilisation intensive demande une quantité importante de mémoire. L’optimisation de la compression de ces informations devient primordiale.
On vous explique le nerf de la guerre : la quantification
La quantification vectorielle est une technique déjà utilisée pour cette compression. Mais jusqu’ici, celle-ci créait au fur et à mesure un « surcoût de mémoire ». Google a annoncé ce mardi 24 mars que ses chercheurs avaient justement mis en place une série d’algorithmes de quantification qui « répond de manière optimale » à ce problème.
De fait, ils avaient mis en ligne leur article sur la plateforme de prépublication scientifique arXiv dès le 28 avril 2025 et celui-ci était passé assez inaperçu. Dans leurs billets, les chercheurs de Google expliquent que leur article a été accepté pour présentation à la conférence scientifique ICLR qui se déroulera du 23 avril au 27 avril 2026 à Rio.
Il reste 81% de l'article à découvrir.
Déjà abonné ou lecteur ? Se connecter
Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.
Accédez en illimité aux articles
Profitez d'un média expert et unique
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
expert et sans pub.
Commentaires (10)
Le 27 mars à 11h54
genre 6 ou 8GB?
Le 27 mars à 13h38
Le 27 mars à 12h29
Le 27 mars à 12h58
Le 27 mars à 16h03
Le 27 mars à 13h41
Le 27 mars à 14h11
Modifié le 27 mars à 16h32
Modifié le 28 mars à 10h56
Le 28 mars à 12h57
Signaler un commentaire
Voulez-vous vraiment signaler ce commentaire ?