Dis Next, c’est quoi un « RAG » en IA générative ?

Rag against the machine

Illustration : Flock

Vincent Hermann

Le 29 juin à 09h09

Ces dernières années, vous entendez peut-être parler de RAG, surtout dans le monde des entreprises. De quoi s’agit-il ? Pourquoi certaines organisations n’ont que ce mot à la bouche ? On vous explique tout, le plus simplement possible.

Dis Next, c’est quoi un « RAG » en IA générative ?

Rag against the machine

Illustration : Flock

Vincent Hermann

Le 29 juin à 09h09

IA et algorithmes

8 min

RAG signifie « Retrieval-Augmented Generation », littéralement « génération augmentée par récupération ». Dans les grandes lignes, c’est un type d’architecture que l’on met en place pour obtenir des réponses rapides et précises sur une base de connaissances spécifiques, en utilisant de l’IA.

Des explications sans (trop de) jargon

Pour comprendre ce que le RAG permet, on utilise souvent l’analogie d’un expert, mais qui n’aurait pas connaissance de l’armoire dans laquelle vous rangez tous vos documents. Il peut s’agir de modes d’emploi, de cartes de vœux, de livres particuliers, voire de factures et d’autres informations que vous avez jugées suffisamment importantes pour les placer là. L’expert en sait beaucoup, mais il ne pourra répondre à aucune question sur le contenu de cette armoire. On peut toujours décrire le type de documents que l’on possède, ses réponses manqueront de précision.

IA générative : le RAG par l’exemple, avec 15 000 actus Next et Mistral 7B

C’est un comportement que l’on retrouve dans les IA génératives habituellement. Elles « savent » quantité de choses, mais si vous êtes dans une entreprise possédant un grand nombre de ressources, l’IA n’y aura probablement pas accès.

Or, ces ressources internes peuvent être à la fois le cœur d’une entreprise comme sa base d’exploitation. Si vous mettez en place un chatbot pour gérer l’assistance, il vaut mieux qu’il ait accès à ces ressources. Les réponses données pourraient sinon être vagues, ou même – pire ! – inventées. Car les IA génératives hallucinent et ont encore bien du mal à répondre simplement « Je ne sais pas ».

Il reste 78% de l'article à découvrir.

Soutenez un journalisme indépendant,
libre de ton, sans pub et sans reproche.

Accédez en illimité aux articles

Profitez d'un média expert et unique

Intégrez la communauté et prenez part aux débats

Partagez des articles premium à vos contacts

Abonnez-vous

La suite de cet article est réservée à nos abonnés

Soutenez un journalisme indépendant,
expert et sans pub.

Abonnez-vous sur next.ink/subs

Commentaires (11)

mokauno Premium

Le 29 juin à 10h01

Merci 👍

Soriatane Premium

Modifié le 29 juin à 10h38

Merci pour cet article

Seb65

Le 29 juin à 11h58

Je suis déjà tombé sur ce genre de système en voulant contacter le support de différentes entreprises.
Mon impression à chaque fois:

L'information que je cherchais existait bien dans leur documentation. Doc trop mal organisée pour trouver par soi-même.

La désagréable impression que ces entreprises cherchent à supprimer toute possibilité de contact humain, ou à le réserver à une option premium. Tant pis pour les gueux s'ils ont un problème que le chatbot ne peut pas résoudre.

Le_Guibock Premium

Le 29 juin à 14h09

Très bon article, merci.
Des responsable sont venus me voir il y a un moment pour récupérer tous les liens vers nos documents techniques sur nos produits (catalogue et notices) . J'imagine qu'ils s'en sont servi pour alimenter un RAG.

kampuchea Premium

Le 29 juin à 15h51

TL;DR: Le RAG c’est la méthode qui consiste à donner la bonne réponse à un LLM puis à s’extasier devant son génie

deathscythe0666 Premium

Le 30 juin à 10h42

En clair, il ne suffit pas de faire ingérer des papiers scannés pour que la magie s’opère.

Ça vise les propos d'un certain ministre, ou je me trompe ?

Luddite26 Premium

Le 30 juin à 16h51

Merci pour le job

R4VEN Premium

Le 30 juin à 18h01

Ce serait quoi finalement la différence entre un RAG et un Claude avec un MCP sur le SharePoint d'une entreprise ? J'ai testé ce dernier cas qui fonctionne plutôt très bien pour retrouver de la documentation ou répondre à des questions dont le contexte métier est dans des docs de l'entreprise.

Sébastien Gavois Équipe

Le 30 juin à 23h26

Je n’ai pas testé, mais l’indexation peut-être ? En MCP tu parcour les docs de ton SharePoint à chaque fois non ? Le RAG pré-mâche le travail avec les chunks et compare ensuite ta requête aux vecteurs des chunks (opération rapide à faire)… ceci dit, je crois que SharePoint dispose d’une API de recherche (reste à voir qui est le plus performant).
Mais il est tard, je suis peut-être en train de me fourvoyer et je vais me coucher

SebGF Premium

Modifié le 1er juillet à 07h40

De ce que j'ai cherché vite fait, ça semble être la diff. Les implems MCP que j'ai trouvé jouent avec les API de Sharepoint pour chercher et lire un doc, là où un RAG ira stocker les documents dans une base vectorielle.

Mes avis que les deux cas d'usage peuvent être complémentaires.

(les API Sharepoint sont d'une atrocité sans nom et documentées avec le cul, soit dit en passant)

R4VEN Premium

Le 1er juillet à 11h40

Merci à tous les deux pour vos réponses ❤️