Le 18 juin dernier, Salesforce a présenté un benchmark LLM consacré à certaines tâches de son CRM. Si le choix du grand modèle de langage est important, c’est surtout l’architecture RAG (Retrieval Augmented Generation) qui guide la pertinence des résultats d’un système infusé à l’IA générative. Cette conviction est partagée par de plus en plus d’éditeurs et par certains clients.

Pour autant, et malgré les discours autour du RAG as a Service, concevoir un système de ce type n’est pas aussi aisé qu’il n’y paraît. Alors qu’il est habituellement le premier à simplifier et à édulcorer les défis techniques, Salesforce fait preuve d’un certain réalisme au moment de proposer son offre de services.

Le 6 juin 2024, il a annoncé la disponibilité générale de Data Cloud Vector Database et d’Einstein Copilot Search.

Data Cloud Vector Database est un service d’indexation et de vectorisation des données low-code/no-code. Techniquement, l’item qui en ressort est un index stocké dans Data Cloud, activable à travers plusieurs services de la plateforme CRM. Einstein Copilot Search est le module de recherche hybride de Salesforce configurable depuis l’interface de la plateforme Einstein 1. Celui-ci est également disponible dans plusieurs solutions de l’éditeur, sous d’autres noms.

Comme ailleurs, ce sont les deux mêmes faces d’une même pièce. « Quand nous parlons de RAG, nous parlons de la structuration de données sous forme de vecteurs et de l’interrogation de cette base vectorielle », rappelle Olfa Kharrat, architecte IA & Data chez Salesforce, lors d’un point presse.

Cette approche est un des moyens de répondre aux deux principaux défis de l’IA : les données et leur traçabilité. « Les entreprises ont besoin d’ancrer les résultats de l’IA générative. Cela s’appelle le “grounding” ».

Des techniques génériques au service de cas d’usage spécifiques L’architecture RAG est une des techniques d’ancrage des résultats des modèles d’IA générative dans une « vérité terrain », mais il est aussi possible d’appeler des attributs structurés ou des fonctions externes (un module de calcul de prédiction, une API, etc.) qui contiendraient l’information souhaitée. Le RAG, lui, serait particulièrement utile pour trouver les quelques documents répondant à la question de l’utilisateur. « Cela n’a pas de sens d’envoyer au LLM des centaines de milliers d’articles de connaissances, pour une question concernant un produit en particulier », illustre Olfa Kharrat. « Cela n’a pas de sens d’envoyer au LLM des centaines de milliers d’articles de connaissances pour une question concernant un produit en particulier. » Olfa KharratArchitecte Data & IA, Salesforce L’architecte rappelle qu’il faut d’abord charger des documents ou des données dans Data Cloud, puis les « chunker », c’est-à-dire les découper en extraits choisis avant de les vectoriser à l’aide d’un modèle d’embeddings. De l’autre côté, il s’agit de convertir les prompts des utilisateurs en vecteurs qui serviront à une étape de recherche de similarité sémantique. « Une fois une question vectorisée, l’on va pouvoir extraire tous les chunks de documents qui ont un sens proche de cette question », explique Olfa Kharrat. Dans Data Cloud, il s’agit d’ingérer des données structurées ou non structurées en les intégrant à une Data Model Object, un objet pour grouper différentes données dans Data Cloud. Mais dans une architecture RAG, « il y a beaucoup de paramètres à prendre en compte », prévient l’architecte. « Beaucoup de clients nous posent la question : “pourquoi faire du RAG dans Salesforce et non pas passer par une plateforme tierce ?”. Ce que nous constatons aujourd’hui, c’est que pour obtenir une architecture RAG optimale, il faut qu’elle soit “accordée” en fonction du cas d’usage ».