Guides Essentiels

RAG : guide de survie pour une implémentation réussie

Introduction

Elle a été très vite perçue comme la technique pour ancrer les résultats des modèles d’IA générative dans le contexte de l’entreprise. Dès 2023, les éditeurs et les entreprises ont testé la mise en place de l’architecture Retrieval Augmented Generation (RAG). Elle a exposé ces primoadoptants à des difficultés bien connues de Google. L’indexation et la recherche d’informations pertinentes dans une base documentaire sont un art.

Oui, l’émergence de l’IA générative en simplifie certains aspects. Pour autant, chaque traitement effectué au cours de ce processus permettant d’obtenir un résultat informé pose son lot de défis. De l’ingestion, en passant par l’indexation, la vectorisation, la recherche et la génération de la réponse. Les influenceurs sur LinkedIn l’affirment haut et fort : « RAG is dead ». L’allongement de la fenêtre de contexte des grands modèles de langage permettrait de se passer de ce fastidieux processus pour obtenir des résultats cohérents et sourcés. C’est faux.

« La RAG n’est pas une solution de contournement pour la taille limitée du contexte », explique Qdrant. « Pour les cas d’usage critiques en entreprise, c’est un moyen d’exploiter des connaissances d’entreprise propriétaires de grande valeur que l’on ne trouvera jamais dans les jeux de données publiques utilisés lors de l’entraînement de LLM ».

Comme ce n’est pas non plus une solution miracle, il est de bon ton d’en limiter les contours. Par exemple, l’indexation de millions de documents n’est pas une bonne idée. Les entreprises les plus avancées semblent se limiter à quelques dizaines de milliers de documents. Par exemple, lors de l’AWS Summit 2025 à Paris, Bureau Veritas a présenté une architecture RAG accessible à 83 000 collaborateurs rassemblant 28 000 documents techniques.

D’autant que le vieil adage « garbage-in, garbage-out » prévaut. Ou, comme le dit Bruno Maillot, directeur Practice AI for Business chez Sopra Steria Next, « l’IA générative, ça ne fait pas des Chocapic ».

Ce guide revient sur les techniques, briques et approches essentielles à la mise en place d’une telle architecture. Il évoque des cas d’usage, les solutions du marché et l’émergence de ce que LeMagIT appelle « RAG as a Service ». Une appellation qui plaît peu aux équipes marketing des éditeurs, mais qui semble traduire assez justement l’intérêt des solutions presque clés en main comme Agentspace, Amazon Q Business et d’autres.

Pour l’instant, la notion de graphe de connaissance – ou GraphRAG – est évoquée, mais pas détaillée. Cette technique avancée donnera lieu à une actualisation de ce dossier, tout comme « l’agentification » des architectures RAG. Quant à l’ingestion de documents véritablement non structurés – fichiers audio et vidéo en tête de liste –, elle est balbutiante.

1Conseils-

Les fondamentaux d’une architecture RAG

Conseils IT

Bien comprendre l’architecture RAG et ses fondamentaux

Désormais perçue comme le moyen idéal pour infuser l’IA générative dans le contexte d’une entreprise, l’architecture RAG implique la mise en œuvre de différentes briques technologiques et pratiques spécifiques. Tous demandent d’effectuer des compromis. Lire la suite

Conseils IT

L’essentiel sur les modèles d’embeddings

Les modèles d’embeddings sont des composants clés des applications de recherche augmentée par l’IA générative. Ce conseil revient sur leurs principales caractéristiques et leurs cas d’usage. Lire la suite

Conseils IT

Comment évaluer un système RAG

Un système RAG est composé de multiples composants. L’évaluation d’un tel système est nécessaire pour juger de son efficacité. Cet article revient sur les trois grands aspects à mesurer : la qualité de la recherche, la qualité des réponses ainsi que les performances techniques et financières. Lire la suite

2Bases de données-

Une brique essentielle de l’architecture RAG

Actualités

RAG : Teradata lance (enfin) Enterprise Vector Store

L’éditeur historique prendra bientôt en charge la recherche vectorielle comme ses concurrents. Il s’attelle cependant à le faire à large échelle, en tentant de compresser les coûts opérationnels. Lire la suite

Actualités

RAG : Avec AlloyDB, GCP est en quête du compromis entre vitesse et précision

Les fonctionnalités d'AlloyDB présentées cette semaine visent à accélérer les recherches vectorielles, au détriment d’une moindre précision des résultats, tout en affinant la mesure de leur qualité. Lire la suite

Actualités

Base de données vectorielle : Qdrant stabilise et améliore ses performances

Qdrant remplace RocksDB par un moteur de stockage maison pour réduire les goulets d’étranglement, compresse son graphe de vecteurs et ajoute la prise en charge des GPU pour réduire drastiquement les temps d’indexation. Lire la suite

Conseils IT

Recherche sémantique, RAG : dix bases de données vectorielles à évaluer

Les bases de données vectorielles propulsent des moteurs de recherche sophistiqués, ainsi que les applications RAG. Voilà dix solutions dédiées à évaluer. Lire la suite

3« RAG as a Service »-

Des solutions clés en main ou presque

Actualités

Agentspace, la « porte d’entrée » de l’Enterprise Search et de l’IA agentique chez GCP

Lors de sa conférence Next 25, Google Cloud a présenté les évolutions en cours d’Agentspace. La peinture est encore fraîche, mais les premiers clients mentionnent des améliorations notables, tandis que des inconnus demeurent. Lire la suite

Actualités

LightOn combine textes et images dans son Visual RAG

LightOn intègre Visual RAG à sa plateforme Paradigm. Cette fonctionnalité traite à la fois les textes et les éléments visuels (images, diagrammes) à l’aide d’un LLM. Une des premières solutions bout en bout du genre. Lire la suite

Actualités

Assistant IA : les arguments d’AWS pour se différencier de Microsoft et Google

Bien qu’il semble en retard, AWS pense que son assistant Amazon Q Business peut simplifier la conception d’architectures RAG, tout en couvrant certaines des tâches habituellement confiées aux agents IA. Il est également prêt à faire évoluer son modèle tarifaire. Lire la suite

4Cas d’usage-

Les premiers déploiements

Projets IT

L’Agence Spatiale Européenne prépare le lancement imminent de son RAG

Le projet « ASK » s’appuie sur Mistral et sur une infrastructure souveraine. Il doit optimiser la recherche et la synthèse d’informations, d’abord scientifiques et techniques. Décollage prévu courant 2025, mais des bénéfices seraient déjà visibles. Lire la suite

Actualités

RAG et IA générative : le groupe SAUR choisit Palantir

SAUR a signé un partenariat « stratégique » pluriannuel avec l’éditeur américain Palantir en vue de déployer des cas d’usage liés à l’IA générative. Le premier d’entre eux consiste à faciliter l’exploration de données dans des contrats de milliers de pages. Lire la suite

Projets IT

RAG : les bonnes pratiques à respecter pour maximiser ses chances de succès

Société Générale et Crédit Agricole ont déployé du RAG pour leurs usages en recherche documentaire. Les performances de ces systèmes sont soumises à la prise en compte de plusieurs impératifs. Des défis persistent en outre. Lire la suite