phonlamaiphoto - stock.adobe.com
IA agentique : Mistral officialise son AI Studio
Vendredi, la startup française a annoncé Mistral AI Studio, une suite d’outils pour aider les entreprises à passer les prototypes d’IA agentique en production. En réalité, il s’agit d’une évolution de La Plateforme, réagencée pour couvrir la conception, le déploiement et le suivi en continu d’agents IA.
Le mur du passage en production. Il semblait difficile à franchir lors de l’ère du machine learning. Voilà que l’ère de l’IA générative semble amplifier le phénomène.
Les performances des modèles d’IA générative, plus génériques, ne seraient-elles pas au cœur du problème ? Mistral AI ne le croit pas. En tout cas, pas totalement. La véritable difficulté réside dans le suivi des changements de comportements des modèles soumis aux mêmes prompts, la reproduction des résultats, l’explication des régressions, la supervision des usages réels et la structuration des retours des métiers. Il faut ajouter à cela, selon la startup, l’incapacité des entreprises à évaluer les modèles sur des benchmarks adaptés à leurs besoins spécifiques, la difficulté à fine tuner les modèles de manière privée et d’assurer la gouvernance des flux d’IA agentique.
« Il existe un écart entre le rythme des expérimentations et la maturité des primitives de production », résument les porte-parole de la startup.
Mistral AI Studio : une rationalisation de l’outillage réclamée par les clients
Actuellement en bêta privée, Mistral AI Studio serait pensé pour répondre à ces enjeux. Cette solution est constituée de briques déjà présentées par le fournisseur de LLM. Son socle n’est autre que l’AI Foundation, une suite de services d’inférence et d’entraînement des modèles de langage.
Celle-ci propulsait déjà une partie des fonctionnalités de la « stack » dédiée à la programmation infusée à la genAI, présentée au cours de l’été. Ici, il s’agit de prendre en charge les déploiements cloud, hybrides et sur site.
Dans le cadre d’AI Studio, AI Foundation est le socle de la suite d’outils AI Builder. Elle comprend AI Registry, Agent Runtime et AI Observability.
AI Registry inclut les modèles et les garde-fous de Mistral AI. Il permet de cataloguer les agents, les connecteurs, les prompts, les jeux de données et les flux de travail arbitraires.
Agent Runtime est présenté comme la « colonne vertébrale » d’AI Studio. Il exécute les pipelines agentiques, contient le SDK Agent, permet de gérer les états et la mémoire des agents IA.
« Chaque agent fonctionne dans un environnement d’exécution avec état et tolérant aux pannes, basé sur Temporal, qui garantit un comportement cohérent lors des réessais, des tâches de longue durée et des appels en chaîne », indique Mistral AI dans un billet de blog.
Temporal est une plateforme d’exécution open source conçue pour les applications distribuées.
Avec Agent Runtime, les documents sont traités et sauvegardés à partir d’un espace de stockage objet, tandis que les graphes statiques qui représentent les chemins d’exécution sont conservés à des fins d’audit.
Temporal et le reste des outils de Mistral AI émettent des données de télémétrie (logs, traces, métriques) envoyées vers la brique Observability. Outre la surveillance des applications et de leur trafic, elle doit permettre de concevoir des évaluations, des jeux de données annotés en mêlant expertise métier, données synthétiques et LLM-as-a-Judge. Ces « juges » peuvent être paramétrés depuis un environnement bac à sable. Ainsi, en combinant données réelles et évaluations, Mistral AI bouclerait la boucle de conception. La brique d’observabilité permet par ailleurs de superviser les coûts des projets (agents IA, fine-tuning, consommation de tokens suivant les tâches, etc.).
Les données annotées ne servent pas seulement à améliorer les agents IA. Elles peuvent entrer dans les recettes d’affinage des modèles, dans une phase d’apprentissage supervisée.
La Plateforme disparaît au profit d’AI Studio
Ce n’est pas la première fois que Mistral AI évoque AI Studio. Cette suite d’outils est déjà utilisée dans le cadre du partenariat avec TotalEnergies. Le laboratoire d’innovation commun s’en sert pour développer plusieurs agents IA. En réalité, AI Studio est une évolution et un réagencement de La Plateforme, la suite PaaS mise sur pied par la startup et hébergée sur Microsoft Azure et Google Cloud. La solution intègre la gestion de compte et d’accès pour les développeurs.
Désormais, les modèles peuvent être appelés depuis Azure AI, Amazon Bedrock, Google Cloud Vertex AI, Snowflake Cortex, Watsonx ou Outscale. Sur site, le déploiement peut s’effectuer avec vLLM et TensorRT. La plateforme AI Studio peut elle-même être déployée sur site ou en cloud privé. Ici, il s’agit principalement d’instrumenter les modèles comme Mistral Medium, Magistral Medium et Mistral Large.
Plus tard, il sera possible d’utiliser les capacités de Mistral Compute, le service IaaS/PaaS que la startup est en train de bâtir depuis un data center non loin du plateau de Saclay.
Les frameworks agentiques pullulent
La mise à jour et le renommage de La Plateforme s’inscrivent dans la compétition continue de Mistral AI avec OpenAI, Anthropic, Google Cloud (Gemini) et Cohere.
OpenAI a lancé Agentkit, une suite d’outils de création d’agents et a acquis récemment Statsig pour renforcer ses fonctions d’évaluation.
Anthropic dispose d’un Agent SDK et d’un lot d’outils accessible depuis la « Claude Console ». Google fait de même pour les développeurs, mais propose également Gemini Enterprise et Google AI Studio (davantage pensé pour la conception d’agents IA en mode low-code/no-code). D’ailleurs, GCP vient de présenter une fonction de Vibe Coding dans AI Studio.
Cohere offre également un lot d’outils, mais s’appuie davantage sur sa collaboration avec LangChain pour permettre aux développeurs de concevoir des flux agentiques. Plus solide sur la recherche augmentée, le fournisseur canadien propose par ailleurs deux « systèmes de travail » : Compass (RAG-as-a-Service) et North (agents IA spécifiques en low-code/no-code).
En outre, AgentCore, la boîte à outils agentique dans Amazon Bedrock est entrée en disponibilité générale à la mi-octobre. Microsoft a également présenté un framework agentique le 1er octobre dernier.
Tous prétendent favoriser l’industrialisation des agents IA. Reste à savoir si cela suffira pour que les entreprises franchissent le fameux mur du passage en production.
