Outre l’effort appuyé de marketing, l’appellation 2.0 derrière Agentforce est justifiée par la disponibilité en février prochain de l’architecture sous-jacente qui permettra le déploiement des agents IA à l’échelle. Comme le reste des solutions Salesforce, elle s’appuie sur l’infrastructure cloud Hyperforce, mais la plateforme de conception d’agents IA est propulsée par ce que l’éditeur a résumé à un moteur de raisonnement nommé Atlas.

Ici, l’effort marketing sert un but précis : tenter d’expliquer aux clients ce qu’il se passe sous le capot de sa plateforme d’IA. Et répondre à la question : « est-ce bien fiable ? ».

Ainsi, avec Atlas dans Agentforce, une requête d’un utilisateur traverse la couche de confiance Einstein Trust Layer avant d’être soumises à un « planificateur » chargé de comprendre l’intention de l’usager, d’établir un plan d’action et de l’exécuter en s’appuyant sur le contexte en provenance d’instances RAG mêlant des mots clés, des documents vectorisés, des données déjà structurées et des métadonnées, par exemple en provenance de la couche sémantique de Tableau (en disponibilité générale depuis le 18 décembre). Des grands modèles de langage sont utilisés pour générer la réponse soumise à un « évaluateur de qualité ». Si la réponse n’est pas suffisamment qualitative, alors l’élément généré est renvoyé au planificateur qui active à nouveau les éléments de la couche RAG. Au besoin, si l’évaluateur rejette les contenus générés, une escalade vers un humain est possible.

En l’occurrence, les entreprises et les chercheurs en IA ont bien compris que la génération augmentée par la recherche (RAG) ne suffit pas toujours à contrôler les résultats d’un LLM. Peut-on alors lui confier des outils, qui plus est pour manipuler des données et des jobs dans des SI critiques ? Salesforce et son équipe de recherche croient que oui, à condition de lui imposer une gouvernance stricte.

« Certains clients ne veulent jamais entendre parler de notre architecture. Il y a des acheteurs qui disent : “Hyperforce, quoi ? Non, je m’en fiche” », déclare Sanjna Parulekar, vice-présidente marketing produit chez Salesforce, auprès du MagIT. « Mais il y a autant de clients qui s’intéressent vraiment à la résidence des données dans Hyperforce. Avec Atlas, ils s’intéressent à la précision et aux techniques que nous utilisons pour développer la consistance des résultats des LLM », justifie-t-elle.

Agentforce : Sous le capot, un système multiagent

Atlas dissimule un DAG : un graphe orienté acyclique qui guide les actions des LLMs

En réalité, Atlas est un système d’IA composite, comme Genie et DatabricksIQ chez Databricks. De fait, Ali Ghodsi et Matei Zaharia, cofondateurs de Databricks ainsi que Naveen Rao, cofondateur de MosaicML, vice-président de l’IA chez Databricks, ont contribué à un article intitulé « La transition de modèles vers des systèmes d’IA composites » (en VO : « The Shift from Models to Compound AI Systems ») publié en février 2024 sur le blog de l’institut de recherche en IA de l’université de Berkeley.

L’idée est simple : les meilleurs résultats en IA générative sont obtenus en s’appuyant sur des systèmes multipliant des composants, et « pas seulement sur des modèles [d’IA] monolithiques ». Salesforce Research a embrassé cette tendance.

« [Atlas] est une architecture graphe de flux de travail orienté événement conçu pour l’inférence en temps réel, intégrant un moteur de raisonnement de type système deux », explique Phil Mui, vice-président de la technologie et responsable des produits et de l’architecture de la recherche en IA chez Salesforce, lors d’un point presse.

Ce concept fait référence à l’ouvrage « Système 1, système 2 : les deux vitesses de la pensée » du psychologue Daniel Kahneman. Avec son confrère Amos Tversky, il a théorisé la séparation entre deux systèmes de pensées : le système 1, rapide, instinctif et émotionnel, du système 2, plus lent, mais réfléchi et logique. En clair, au centre de ce système 2 se tient un LLM du même type que 01 d’OpenAI. Mais il n’est pas seul.

« Chaque agent du moteur de raisonnement Atlas, coordonné avec un orchestrateur-concierge, raisonne en autonomie sur des tâches spécifiques, le tout surveillé par des flux de travail pilotés par des événements » Phil Muivice-président de la technologie et responsable des produits et de l’architecture de la recherche en IA

« Chaque agent du moteur de raisonnement Atlas, coordonné avec un orchestrateur-concierge, raisonne en autonomie sur des tâches spécifiques, le tout surveillé par des flux de travail pilotés par des événements », détaille Phil Mui dans un billet de blog.

Un agent a besoin d’état – de données accessibles par les LLM à travers l’architecture RAG – et de flux, d’un cadre programmatique pour guider ses actions. Un agent provoque des « effets secondaires » : essentiellement, il crée, modifie ou supprime des données dans les produits Salesforce et – bientôt des systèmes tiers.

Si l’interface utilisateur les masque, des fichiers déclaratifs YAML permettent de définir le rôle, les données, les actions, les garde-fous et les canaux attribués à un agent.

D’autres acteurs présenteraient Atlas comme un système multiagent. En clair, plusieurs LLMs à qui l’on a confié un rôle spécifique agissent de concert, mais de manière autonome. L’architecture pub/sub doit permettre une communication asynchrone entre les agents et de les découpler. Outre le fait que ce couplage « léger » permet de paralléliser les traitements, les flux de travail événementiels incluent des règles et des déclencheurs qui orientent leurs activités. En principe, les flux de travail peuvent aussi déclencher l’appel à des outils et à d’autres modèles de machine learning ou de deep learning pour compléter un traitement.

Les éléments de la couche de confiance, les techniques avancées de RAG, les filtres doivent assurer le contrôle des résultats. Salesforce supervise le tout à travers (entre autres) des logs d’audit. D’autres entreprises, dont Pegasystems, un concurrent de Salesforce, s’est montré sceptique à l’idée de confier autant d’importance à des LLM connus pour halluciner. Salesforce répond qu’elle a mis en place les garde-fous et la sécurité nécessaire, et que son système serait 33 % plus efficace que les solutions concurrentes, selon les pilotes menés avec les clients.