Chaosamran_Studio - stock.adobe.
TDX 2026 : Salesforce renforce le déterminisme et la gouvernance de ses agents IA
À l’occasion de la conférence développeur TDX 2026, Salesforce a lancé Agent Script, un langage open source pour infuser davantage de déterminisme dans les flux de travail agentiques. Cette intégration s’accompagne d’une révision de son IDE agentique et de ses outils de gouvernance. L’objectif : donner aux développeurs un contrôle plus fin sur le comportement des agents en production.
Salesforce a de nouveau remanié son arsenal d’outils destinés à l’IA agentique. Des agents IA qui génèrent d’autres agents en suivant des flux déterministes, des fonctionnalités avancées d’orchestration, de test et de supervision sont les principales annonces présentées à San Francisco cette semaine.
L’ensemble de ces outils répond aux enseignements tirés des dix-huit premiers mois d’Agentforce. Le constat est clair : les quelques 23 000 clients (pour 29 000 contrats Agentforce signés en février 2026) qui adoptent Agentforce (dont Adecco, Bouygues Telecom, Spoticar) réclament un contrôle plus fin sur leurs agents IA. D’après les dires des dirigeants de Salesforce en février dernier, plus de 4000 clients auraient passé le cap de la production pour un agent ou plus.
Salesforce a compris qu’il fallait rassurer les clients pour faire passer leurs projets pilotes en production. Les utilisateurs ne peuvent craindre que leurs agents fonctionnent sans limites et outrepassent leurs prérogatives, souligne Rebecca Wettemann, fondatrice de Valoir, cabinet d’études indépendant.
Les entreprises doivent pouvoir maîtriser le comportement de leurs agents dans la durée, à mesure que la technologie s’intègre aux systèmes informatiques et que ses effets, voulus ou non, se révèlent.
« Nous sommes passés du FOMO – la peur de rater quelque chose – il y a deux ans, au FOMU – “la peur de tout faire planter” », observe Rebecca Wettemann. « C’est là qu’intervient la gouvernance. Il ne s’agit pas seulement de mettre l’IA en production, mais de la piloter et de la surveiller dans le temps. »
Un IDE agentique à la mode ReAct
Avant d’en venir à la gouvernance, ce contrôle passe d’abord par les outils de conception des agents IA.
Influencé par Anthropic, Salesforce a annoncé la disponibilité générale de son IDE agentique Agentforce Vibes 2. Le produit pourrait être renommé Agentforce Code. Cette nouvelle version a été « totalement reconstruite », précise Stephan Chandler-Garcia, directeur principal de l’ingénierie de contenu technique chez Salesforce.
Basé sur VS Code et compatible MCP, l’IDE en cloud est intégré à Salesforce ALM, Code Analyzer et DevOps Center. Propulsé par Claude Sonnet 4.5 par défaut, Agentforce Vibes 2 intègre deux modes. Le mode planification permet d’analyser le code et de générer des spécifications avant de générer le code. Le mode « Act » crée et modifie des classes Apex, des LWC et les tests. Agentforce Vibes 2 est donc un enfant de la méthode ReAct (réfléchir avant d’agir, raisonner avant de générer du contenu).
L’édition Developer d’Agentforce Vibes 2 inclut 1,5 million de tokens par mois pour un maximum de 110 requêtes par mois pour Claude Sonnet 4.5.
Salesforce a également revu en profondeur Agentforce Studio. Non seulement l’interface reprend une bonne partie des standards promus par Anthropic, mais le système prend désormais en charge les sous-agents et les skills, à la manière de Cowork. Une trentaine de skills préconfigurés sont disponibles. Les topics sont devenus des sous-agents.
Agent Script combine déterminisme et probabilisme dans les flux de travail agentiques
Outre l’usage des sous-agents à qui un LLM orchestrateur peut confier des tâches, Salesforce a annoncé la disponibilité générale d’Agent Script. Agent Script est un langage de spécification à vocation open source conçu à l’origine pour les besoins d’Agentforce.
Cette syntaxe permet de configurer des agents IA à l’aide de blocs de construction : des ancres, des événements, des procédures stockées, des données, etc. Il est possible de mettre en place des conditions de type if/else, de programmer des transitions, des logiques ou encore de comparer des variables.
« Agent Script décrit ce qu’est l’agent – son état, les actions dont il dispose, ses instructions – et non la manière dont le moteur d’exécution le met en œuvre », expliquent les ingénieurs de Salesforce, dans la documentation GitHub. « Cela signifie qu’un même script peut s’exécuter sur des moteurs d’exécution de plus en plus performants sans qu’il soit nécessaire de modifier une seule ligne de code. Vous définissez l’agent, vous ne l’implémentez pas ».
Ce système peut donc être comparé à la plupart des solutions déclaratives, comme Dagger, HashiCorp Terraform ou Ansible. Cela tombe bien, les LLM adorent les langages déclaratifs, puisqu’ils sont lisibles par les humains.
À ceci près que certaines exécutions peuvent être déterministes, et d’autres probabilistes.
« Il faut se représenter le flux d’exécution comme un graphe où les sous-agents IA sont des nœuds », explique Olfa Kharrat, directrice de la gestion produit IA et Agentforce chez Salesforce, lors d’un point presse à Paris. « Les transitions entre les sous-agents peuvent être déterministes, par exemple vérifier l’identité d’un client, ou menées par un LLM ». Il s’agit là d’un framework de graphe orienté acyclique. Agent Script pourrait s’apparenter au langage du fameux moteur de raisonnement Atlas.
À l’origine, il s’agissait de propulser un système multiagent. Les interactions avec les outils étaient une capacité en cours d’exploration en 2024. Salesforce utilisait alors des fichiers YAML.
Le runtime d’exécution est pour l’instant propriétaire. Le parser, le linter, le compilateur et les outils sont open source. Les équipes derrière le projet cherchent un « chemin » pour rendre ce runtime ouvert ou pour rendre compatible Agent Script avec d’autres runtimes.
A noter que Salesforce prévoit la disponibilité générale d’un moyen de déploiement des agents au niveau d’une Org. Lors de Dreamforce 2026, l’éditeur lancera un système de supervision multi-Org.
Cette ouverture permet néanmoins aux IDE agentiques comme Claude Code, Cursor et Agentforce Vibes de créer des agents capables d’exploiter des workflows déterministes. Ce scénario « d’agents créant des agents » se généralise rapidement, note Stephan Chandler-Garcia. Salesforce entend fluidifier ce processus grâce à des serveurs MCP qui enseignent aux agents de code comment utiliser les métadonnées de Salesforce et de l’utilisateur, ainsi qu’à des environnements de test accélérant leur mise en service.
Une avancée majeure, estime Rebecca Wettemann.
« Les gens réalisent, après avoir suffisamment expérimenté avec cette technologie probabiliste, que ce n’est pas toujours la solution optimale », explique-t-elle. « Si je traite un sinistre d’assurance, je veux des résultats cohérents et auditables à chaque fois. Certaines opérations n’admettent aucune interprétation. »
Joe Inzerillo, président de la technologie d’entreprise et d’IA chez Salesforce, reconnaît lui aussi la nécessité de combiner ces deux approches dans la conception et la maintenance des agents IA.
« Les agents ne sont pas des logiciels », affirme Joe Inzerillo. « […]Ce sont des systèmes bien plus probabilistes et stochastiques. Autrement dit, on ne peut pas nécessairement fournir la même entrée et obtenir la même sortie à chaque fois. Cela exige des outils différents, un cycle de développement différent. »
Agent Script est disponible dans Agentforce Vibe, dans Agentforce Studio et dans Agent Broker de MuleSoft.
Une boucle d'observabilité agentique à compléter
Cette manière plus déterministe de concevoir des agents IA ne supprime pas la nécessité de tester, d’itérer et de surveiller leur comportement.
Le centre de tests, présenté l’année dernière, doit être disponible au mois de mai, et les évaluations sont encore en bêta.
« Le centre de tests est un outil qui utilise l’IA pour générer automatiquement des milliers de scénarios de test – des requêtes basées sur les données clients (tickets résolus précédemment, articles de connaissance) », présente Olfa Kharrat. « Il vérifie ensuite que l’agent exécute les bonnes actions et respecte les instructions ».
« Cette validation massive crée la confiance nécessaire avant le déploiement », vante-t-elle. « Une fois l’agent en production, un LLM as a Judge peut évaluer en temps réel chaque conversation pour s’assurer de la qualité des réponses et du respect des consignes. Les clients peuvent ainsi surveiller les performances et détecter toute dérive qualitative ».
De ce que comprend LeMagIT, puisque le recours au LLM coûte cher, cette supervision à l’aide d’un LLM as a Judge peut être mené en planifiant des mesures par échantillonnage.
Si ces évaluations et ces éléments de supervision permettent de prévoir des optimisations des agents IA, cette phase n’est pas encore automatisée.
« Je pense qu’il y a encore beaucoup de travail à faire avant de modifier directement un agent IA ou son contexte », estime Olfa Kharrat. « Cependant, en matière d’observabilité, nous travaillons sur cette notion de prise d’actions, par exemple quand l’on détecte qu’un agent dérive ».
Salesforce indique par ailleurs que les graphes Agent Script permettent de renforcer l’observabilité des agents IA déployés sur sa plateforme. À partir des traces, l’outil de supervision précise le temps nécessaire à l’exécution de chaque tâche et sous procédures.
Headless 360 : vers une architecture plus modulaire
Autre initiative majeure, le projet Headless 360 doit rendre disponible l’ensemble des fonctions Salesforce en serveurs MCP, fonctions CLI et API. L’objectif : rendre la plateforme plus modulaire pour les développeurs souhaitant déporter leurs cas d’usage de l’interface Salesforce vers leurs propres applications et agents IA. Dans un premier temps, Salesforce lancera un client MCP adossé à la plateforme Agentforce. Il permet d’interroger des serveurs MCP tiers, dont ceux de Google, Microsoft, SAP, etc. Il sera disponible au cours du mois d’avril. Au total, une soixantaine d’outils associés au protocole proposé par Anthropic sont prêts à la production. De plus, Salesforce prend en charge le protocole A2A, en version 1.0 depuis le 10 mars.
En outre, l’éditeur a (re)présenté AgentExchange, une marketplace partenaire qui fusionne AppExchange, Slack Marketplace et l’écosystème Agentforce lancé en mars 2025. Selon Salesforce, près de 14 000 applications, agents et outils Slack y sont disponibles.
Une solution unique de gouvernance, pas d’exécution
Venons-en à la gouvernance. Salesforce Agent Fabric, issu de MuleSoft Agent Fabric, fait peau neuve. La plateforme lancée en septembre 2025 intègre désormais un tableau de bord qui centralise le suivi des agents et des serveurs MCP, qu’ils proviennent de Salesforce ou d’autres plateformes comme Amazon Bedrock, Microsoft Foundry et GoDaddy.
Ce suivi est permis par des scanners d’agents. Ils doivent découvrir automatiquement les serveurs MCP et les actifs IA des outils tiers cités ci-dessus et les connecter à Agent Fabric à l’aide du protocole OAuth 2.
S’y ajoutent un canevas de création visuelle qui cartographie les points de contrôle agentiques et humains dans les flux de travail, ainsi que des outils de gouvernance et d’authentification. Ces derniers permettent d’intégrer des règles métier directement dans le fonctionnement des agents, notamment pour les processus sensibles comme les transferts de fonds.
L’ambition de Salesforce est de proposer une solution de gouvernance pour tous les agents IA, y compris ceux des éditeurs tiers. Or ces mêmes acteurs, concurrents ou partenaires, partagent cette ambition. « D’après mon expérience, les DSI cherchent une plateforme unique pour gouverner tous les agents IA, non pas pour les orchestrer », nuance Olfa Kharrat. « L’orchestration se fera suivant les cas d’usage et les solutions associées ».
En clair, MuleSoft et Salesforce par extension pourraient se présenter comme une sorte de solution d’API management pour les agents IA. Dans un même temps, MuleSoft a présenté en mars la « GA » de MCP Bridge, un moyen d’exposer des API existantes pour les convertir en serveurs MCP à travers la Flex Gateway. Il est possible de préciser quelles fonctions GET de l’API sont exposées.
Cet article s’appuie en partie sur des éléments publiés par Don Fluckinger pour SearchCustomerExperience.
