Deep Reasoning : Microsoft fait raisonner ses agents IA

Microsoft commence à exploiter les modèles de raisonnement et en fait des agents. Ceux-là seront capables de s’appuyer sur les données de l’entreprise pour établir des rapports et analyser des données structurées.

Lors du Microsoft AI Tour à Paris, le géant du cloud a fait part de sa vision de l’IA agentique. Selon les propos de Corine de Bilbao (en photo ci-dessus), présidente de Microsoft France, il existe « trois grandes catégories » d’agents IA.

Trois catégories d’agents IA selon Microsoft

« La première, c’est la plus simple : elle correspond aux agents conversationnels (les chatbots), c’est-à-dire des agents qui vont récupérer des informations, les résumer, les traduire et les formaliser dans un format qui vous convient », explique-t-elle. Ce serait typiquement un assistant IA couplé à une architecture RAG permettant à un employé d’accéder aux informations sur ses congés.

La deuxième catégorie incorpore des agents doués d’actions « simples ». « Cela peut être un agent dans un service après-vente capable d’ouvrir un ticket, de chercher des informations et d’y répondre », illustre la présidente. « Ici, l’on a automatisé un processus simple ».

La troisième catégorie, « la plus prometteuse en matière de productivité et d’automatisation », renvoie à des agents capables de travailler ensemble et avec les salariés d’une organisation. Ils pourraient organiser « tout un processus ». Ceux-là, les entreprises commencent à les expérimenter. Les porte-parole de Microsoft le reconnaissent : toutes les conditions pour maîtriser ces essaims d’agents autonomes ne sont pas encore réunies.

Dans un même temps, les agents capables de réaliser des actions bénéficient des travaux lancés par les fournisseurs de LLM. En ce sens, Microsoft a présenté la préversion de Deep reasoning au sein de Microsoft Copilot Studio.

À la manière de Deep Research d’OpenAI et de DeepSearch de Grok, Deep Reasoning permet d’effectuer des analyses approfondies et de produire un rapport sur un sujet spécifique. Mais au lieu de le limiter au Web, comme l’on fait OpenAI et Grok, Microsoft rend possible cette recherche plus longue sur les documents de l’entreprise.

Deep reasoning et agent flows, deux briques nécessaires à la conception d’agents qui raisonnent

Il s’agit par exemple de réaliser des rapports sur les tendances d’un marché, de répondre à un appel d’offres complexe, ou encore d’optimiser la chaîne d’approvisionnement, selon Microsoft.

« Les modèles de raisonnement avancés passent plus de temps à réfléchir avant de générer des résultats, ce qui donne des agents capables d’analyser des jeux de données et de reconnaître des schémas complexes, ainsi que de proposer des décisions réfléchies », vante Charles Lamanna, vice-président corporate, business & industry Copilot chez Microsoft, dans un billet sur LinkedIn. « Lorsque vous combinez cela avec les connaissances de votre entreprise, vous pouvez commencer à appliquer les agents à des processus entièrement nouveaux ».

Oui, Deep Reasoning est une fonctionnalité pouvant être manipulée par un agent. Dans Copilot Studio, un simple mot clé (« reason ») suffit à appeler la fonction, mais elle peut également s’inscrire dans un flux permettant d’invoquer des données depuis un ERP Microsoft (ou non), le Web, des bases de connaissances Sharepoint, etc. In fine, le rapport peut être généré et envoyé sur un canal Teams de l’utilisateur.

En sus d’effectuer ces raisonnements sur des données internes, Microsoft introduit des « agent flows ».

« Ils sont conçus pour gérer des scénarios prévisibles et répétitifs tels que le traitement des documents, les approbations financières de routine et les tâches de conformité », avance Charles Lamanna. « En combinant l’automatisation structurée et les actions stratégiques de l’IA, ils simplifient les points de décision complexes tels que les conditions, les exceptions et les boucles ».

Microsoft avait déjà combiné les LLM disponibles depuis Power Automate pour créer des flux agentiques. Avec agent flows, il est possible de composer la structure en langage naturel ou en low-code/no-code à travers Copilot Studio. « La même expérience low-code et la même plateforme qui alimentent Power Automate sont utilisées en coulisses », affirme Charles Lamanna.

Ensuite, chaque étape peut être définie avec des instructions (des prompts) et en ajoutant les sources de données. Peu importe si le flux a été développé depuis Power Automate, Copilot Studio, ou s’il réclame l’appel à des API tiers. Les agents ont potentiellement accès à ces flux de travail.

Research et Analyst : des agents de raisonnement clés en main dans Microsoft Copilot

 Microsoft se sert des mêmes briques pour bâtir Researcher et Analyst. Ces deux agents annoncés entre hier et aujourd’hui seront disponibles sur étagère depuis Microsoft 365 Copilot.

Researcher est un moyen de créer des rapports de recherche ou d’évaluation à partir des données de l’entreprise dans la sphère Microsoft et en dehors (Salesforce, ServiceNow, Confluence, etc.), ainsi qu’en effectuant des recherches Web. Il s’adresse aux experts métiers. Il s’appuie sur une version fine-tunée d’OpenAI o3.

« Nous fournirons aux usagers finaux et aux administrateurs la possibilité de personnaliser Researcher en intégrant leurs propres agents dans le flux de travail de Researcher. »
Gaurav AnandCVP, Microsoft 365 Engineering

Researcher analyse la requête de l’utilisateur et lui demande éventuellement des clarifications. Ensuite, il effectue des recherches dans les données à disposition et les jauge. Puis, il produit une synthèse. Les entreprises pourront décider d’améliorer ce processus ou encore choisir le point de livraison du rapport (Outlook, Teams, etc.). Microsoft envisage, par ailleurs, que Researcher interagisse avec d’autres agents IA.

« Nous fournirons aux usagers finaux et aux administrateurs la possibilité de personnaliser Researcher en intégrant leurs propres agents dans le flux de travail de Researcher », promet Gaurav Anand, CVP, Microsoft 365 Engineering.

Analyst, lui, cible les data analysts et les membres des équipes de data science. À partir de tables sources (XLSX, TSV, CSV, JSON, etc.), l’agent propulsé par une version post-entraînée d’o3 mini est non seulement capable de rédiger et d’exécuter le code Python (dans un environnement « sécurisé »), mais aussi de créer des visualisations de données. Un usager peut alors demander de croiser les données en provenance de fichiers dans deux formats différents, afin d’identifier des indicateurs clés ou des problèmes de qualité.

Les équipes de Microsoft semblent s’être inspirées de l’approche du Chinois DeepSeek. « L’efficacité du modèle de raisonnement avancé derrière Analyst repose en grande partie sur l’apprentissage par renforcement (RL) », explique Xia Song, CVP [Corporate Vice-President], Microsoft 365 Engineering. « Engendré en affinant le modèle o3-mini d’OpenAI après son entraînement initial, il utilise un RL avancé associé à des récompenses basées sur des règles pour gérer des chemins de raisonnement complexes, la découverte progressive d’informations et l’exécution dynamique de code », poursuit-il.

Et de remarquer qu’à l’entraînement ou à l’inférence, plus le temps et la puissance de calcul sont importants, alors meilleurs sont les résultats.

Pour l’heure, Microsoft n’a pas communiqué sur la date de disponibilité de ces deux agents ni leur tarification. Comme l’a souligné Xavier Perret, directeur cloud Azure chez Microsoft France lors du Microsoft AI Tour, les modèles de raisonnement sont « plus gourmands en puissance de calcul et donc plus chers ».

Crédits photo : Gaétan Raoul, lors du Microsoft AI Tour à Paris, 2025

Pour approfondir sur IA appliquée, GenAI, IA infusée