Lakehouse : Microsoft adapte Fabric pour y héberger des agents IA

A l’instar de Snowflake, Databricks et Google Cloud, Microsoft veut déployer des agents IA au plus près des données des entreprises. Encore faut-il qu’elles adhèrent à son approche de bout en bout, soulignent les analystes.

En même temps que Snowflake dévoilait sa feuille de route au Moscone Center devant plus de 20 000 participants à sa conférence annuelle, Microsoft menait à quatre kilomètres de là son événement Build.

Le salon situé à Fort Mason, à San Francisco, a réuni un peu moins de 2000 visiteurs. Outre ses LLM, le géant du cloud en a profité pour présenter les avancées de Microsoft Fabric.

La plateforme « unifiée » de gestion de données refondue en 2023 serait utilisée par 35 000 clients, contre 25 000 en septembre 2025. La firme de Redmond en tirerait un revenu récurrent annuel de 2 milliards de dollars, en hausse de 60 %. Il faut dire que Microsoft y place désormais ses bases de données, ses services analytiques, sa Data Factory, OneLake, Power BI et Fabric IQ. Fabric IQ est une suite pour constituer un graphe de connaissances pour les agents IA.

Et les porte-parole de l’éditeur de commencer par la base : l’ingestion de données.

Outre des connecteurs pour SAP Datasphere, Sharepoint, OneDrive et Oracle DB en disponibilité générale, Microsoft a annoncé la préversion publique de « raccourcis » pour Azure DB for MySQL et Dremio. Dans les deux cas, il s’agit de surfacer les données dans OneLake. Des connecteurs pour Azure Monitor et AWS Glue sont sur la feuille de route, mais leur date de disponibilité n’a pas été annoncée. Il est possible de stocker les données ou de les représenter dans OneLake.

Mais ils ont surtout mis l’accent sur de nouvelles capacités visant à accroître les performances des traitements.

Le CPU, une puce parmi d’autres pour accélérer les requêtes SQL

Les entrepôts de données Fabric ont le droit en préversion limitée à de l’accélération des requêtes à l’aide de GPU. Cette capacité, activable dans la console, serait particulièrement adaptée au traitement des requêtes concurrentes. Le traitement de 100 Go de données interrogées par 64 utilisateurs concurrents serait sept fois plus rapide.

 Il faut toutefois prendre les facteurs d’accélération donnés par Microsoft avec des pincettes. Les gains affichés ne sont valables que dans le cas où les données tiennent dans la mémoire des instances GPU.

Microsoft n’est pas le premier à proposer l’accélération des traitements de données avec des GPU. Toutefois, la plupart des implémentations vues jusqu’ici s’appuient sur la librairie RAPIDS de Nvidia. Ici, Microsoft a développé son propre framework en s’appuyant sur les mêmes sous-jacents : NVLINK et Infiniband.

Cette accélération GPU introduit surtout une couche d’abstraction qui permet de subdiviser un plan de requêtes et de l’envoyer vers plusieurs « coprocesseurs » : des GPU, des ASICs et des FPGA. Il fait peu de doute que Microsoft y connectera son CPU Cobalt 200 et sa puce IA Maia 200.

Reste à voir le prix d’un tel service : un client s’est demandé si cette fonctionnalité ne serait pas facturée sept fois plus cher.

Dans un même temps, Microsoft Fabric prend en charge Spark 4.0 et Delta 4.0, deux technologies open source portées par Databricks. Une fonctionnalité nommée « custom live pool » doit réduire le temps de chargement des librairies et des configurations de sécurité avant d’exécuter un notebook. Là où ce démarrage prenait « trois à cinq minutes », il ne réclamerait plus que « trois à cinq secondes ».

L’IA à toutes les sauces, surtout agentique

Au-delà des connecteurs et des performances, Microsoft a évidemment fait la part belle à l’IA agentique.

Comme Snowflake et Databricks, Microsoft ajoute des fonctions IA activables à l’aide de notebooks Python via PySpark ou depuis des requêtes SQL à travers Dataflow gen 2 (en préversion). Celles-ci s’appuient sur des LLM pour analyser des sentiments, classer des données texte, générer automatiquement des vecteurs, extraire des données, corriger des textes, générer des données synthétiques, comparer des documents, les résumer ou les traduire. Aux entreprises de choisir le LLM de leur choix depuis Azure OpenAI ou Microsoft Foundry (Qwen, Kimi, Grok, Llama, Mistral AI, etc.).

Tout comme Microsoft mise non seulement sur les agents IA dédiés à la gestion de données, mais aussi sur les skills. Ceux-là doivent déterminer le comportement des IDE agentiques, que ce soit GitHub Copilot, Cursor ou Claude Code. Les skills en préversion publique couvrent les tâches liées au SQL, à l’usage d’Apache Spark et de Kusto Query Language (KQL), ainsi qu’à la création de rapports dans Power BI.

Il est par ailleurs possible de configurer des alertes avec Fabric Activator afin d’être informé en cas d’anomalie des données manipulées par les fonctions IA ou les IDE agentiques dotés de skills.

Fabric IQ : la métacouche sémantique de Microsoft se stabilise

Microsoft avait présenté en novembre 2025 les trois étages de sa couche sémantique Fabriq IQ. Outre le stockage des différents types de données dans OneLake, les modèles sémantiques demeurent portés par PowerBI.

De plus, il faut encore créer des ontologies de données. Ce sont des glossaires de concepts métier associés aux données représentés à travers Microsoft Graph. Les ontologies sont désormais accessibles en préversion publique depuis Microsoft Foundry, Copilot Studio et Agent 365.  

Au sein de l’ontologie, le fournisseur définit une entité, ses propriétés, ses actions et ses objectifs. Pour l’instant, ce graphe est applicable aux données passées, mais Microsoft entend l’appliquer aux données entrantes en temps réel. Ces éléments passés et présents servent à prédire des données structurées avec Planning In Fabric (bientôt en disponibilité générale). Un data lineage est disponible pour ces prévisions afin de comprendre les modifications effectuées. Le planning peut être ajouté à l’ontologie.

Il s’agit ensuite de nourrir les agents IA des métiers avec ces ontologies. C’est désormais possible à travers les « Operations Agents », en disponibilité générale. Ceux-là peuvent être configurés avec des instructions, un lien au contexte et des déclencheurs dans Fabric Real-Time Intelligence. Le tout est appelé un « playbook ». Il est ensuite possible d’enclencher des actions à travers des flux Power Automate. Là, le rôle du LLM est restreint puisqu’il ne sert qu’à convertir en langage naturel des règles et des actions.

Rayfin, un SDK pour guider le déploiement des agents IA sur Fabric

Comme ses concurrents, Microsoft veut maîtriser la chaîne de valeur de bout en bout. D’où le lancement d’une solution pour héberger des applications et des agents IA dans Fabric. « Nous fournissons un back-end managé qui contient tous les services dont vos applications ont besoin », assure Amir Netz, directeur technique de Microsoft Fabric, dans une session préenregistrée pour Build. « Et il ne s’agit pas seulement de bâtir des applications analytiques, mais de véritables applications métiers », assure-t-il.

Comme le code de ses applications sera généré par des modèles IA, le fournisseur a présenté un nouvel outil dans son « harnais IA » : le SDK open source Rayfin. Présenté comme un « back-end à la demande », en préversion, Rayfin permet de définir un modèle de données avec des décorateurs TypeScript. Puis, le framework s’appuie sur les services Azure pour gérer la base de données, l’authentification, les API, le stockage et l’hébergement en générant les actifs correspondants. Un mode expérimental permet de prendre en charge des déploiements locaux.

Pour les analystes de Futurum Group, Rayfin inverse « la séquence habituelle » entre les équipes de développement et les responsables de la gouvernance. « La gouvernance a traditionnellement été une étape bloquante que les W rencontrent juste avant le déploiement, sous forme d’une liste de contrôle administrée par une équipe distincte, avec un calendrier différent », écrivent-ils. « Rayfin traite la gouvernance comme le substrat sur lequel l’application est construite ».

De plus comme tous les éléments sont gérés dans Fabric, les agents IA créés de cette manière peuvent potentiellement écrire dans un back-end où les garde-fous sont en place. D’autant que les agents ont accès au contexte via Microsoft IQ.

Pour l’instant, malgré les dires d’Amir Netz, les Apps Fabrics sont idéales pour des prototypes, des tableaux de bord, des outils de visualisation et des agents IA qui ont besoin de stocker des états. Les transactions en plusieurs étapes, les procédures stockées et tous les systèmes qui en dehors du SSO de Fabric ne sont pas pris en charge, selon la documentation Azure.

Après l’interopérabilité des données, le défi de l’orchestration des agents IA

« Rayfin réduit de manière significative le fardeau de la gouvernance pour les nouvelles applications entièrement construites dans Fabric », poursuivent les analystes du Futurum Group. « En revanche, la gouvernance des applications qui s’étendent sur plusieurs plateformes de données reste un problème non résolu ». C’est la principale limite de l’approche de Microsoft, constatent-ils.

Reste à savoir « si le modèle d’architecture de confiance de Microsoft devient un modèle industriel ou s’il reste un avantage réservé à ses clients ».

Dans les faits, Snowflake et Databricks cherchent à faire de même. Les éditeurs de systèmes ombrelles tels UiPath ou ServiceNow sont plus enclins à développer des flux agentiques qui traversent différents SI.

Auprès de SearchDataManagement, une publication sœur du MagIT, William McKnight, analyste indépendant, remarque que Microsoft n’a toujours pas intégré Microsoft Fabric à la couche de gouvernance et de sécurité Purview. Il n’a pas non plus présenté de fonctions LLMOps. Elle serait nécessaire pour faire de Fabric « une solution sûre pour le déploiement de l’IA en production ». Snowflake a proposé des fonctionnalités en ce sens et il fait peu de doutes que Databricks prépare une annonce similaire pour sa conférence annuelle, du 15 au 18 juin 2026.

En attendant, certains clients de Microsoft et de ses concurrents constituent leurs propres harnais IA. S’ils privilégient une plateforme plutôt qu’une autre pour ancrer leurs agents IA dans le contexte de l’entreprise, les LLM, les outils, les serveurs MCP, etc., doivent être interchangeables. Les éditeurs visent désormais une catégorie d'organisations moins avancées, celles chez qui la gravité des données les emmènera naturellement à choisir une solution de bout en bout.

Pour approfondir sur Datawarehouse