MongoDB et Microsoft se rejoignent autour de l’analytique et de la GenAI

Alors que le géant du cloud favorisait jusqu’alors CosmosDB, son alternative à la base de données de MongoDB, il change d’attitude en établissant un partenariat approfondi visant à accélérer l’adoption de la DbaaS MongoDB Atlas, du « lakehouse » Microsoft Fabric, et, in fine, de son infrastructure cloud.

Le 19 novembre, lors de MongoDB Local Paris, qui se tenait en parallèle de Microsoft Ignite 2024 Ă  Chicago, l’éditeur du SGBD NoSQL Ă©ponyme a annoncĂ© un partenariat avec le fournisseur de cloud.

GenAI : Atlas devient un « vector store Â» pour Azure AI Foundry

Sans surprise, il est question d’IA gĂ©nĂ©rative. Ainsi, la DBaaS MongoDB Atlas s’intègre avec Azure OpenAI Service et son chapeau Azure AI Foundry. Atlas peut alors servir de base de donnĂ©es vectorielle afin de propulser des applications de type RAG (Retrieval Augmented Generation) en lien avec les services et produits Microsoft.

« Aujourd’hui, l’intĂ©gration native avec Azure AI Studio offre aux clients la possibilitĂ© de concevoir rapidement des applications en utilisant quelques lignes de code, des API, et leurs propres donnĂ©es Â», affirme FrĂ©dĂ©ric Favelin, global Head Cloud Partner Solutions architect chez MongoDB. « Cela reprĂ©sente un gain considĂ©rable en temps et en efficacitĂ©, particulièrement dans le dĂ©veloppement d’applications comme des chatbots, des Copilot ou des solutions internes Â».

Gartner, Deloitte, BCG X et d’autres s’entendent sur une chose : bien qu’une majoritĂ© d’entreprises ont testĂ© l’IA gĂ©nĂ©rative, une minoritĂ© d’entre elles l’ont dĂ©ployĂ© en production. Entre mai et juin 2024, Deloitte a menĂ© une Ă©tude auprès de 2 770 participants. « De nombreux efforts en matière d’IA gĂ©nĂ©rative en sont encore au stade du projet pilote ou de la validation de concept Â», constate Deloitte. « Une grande majoritĂ© des personnes interrogĂ©es (68 %) dĂ©clare que leur organisation a fait passer 30 % ou moins de ses expĂ©riences d’IA gĂ©nĂ©rative en phase de production Â».

D’oĂą la nĂ©cessitĂ©, selon FrĂ©dĂ©ric Favelin, de proposer ce type d’intĂ©gration, ainsi que d’accompagner les entreprises. « C’est l’un des objectifs de nos programmes d’accĂ©lĂ©ration, car l’intĂ©gration des entrepĂ´ts vectoriels avec les LLM n’est pas si aisĂ©e qu’il y paraĂ®t Â».

Favoriser les usages de Microsoft Fabric

Le partenariat entre Microsoft Azure et MongoDB couvre surtout l’intĂ©gration d’Atlas avec Microsoft Fabric, la suite de traitement de donnĂ©es concurrente de Databricks et Snowflake. Elle rassemble Azure Synapse (ex-SQL Data Warehouse), Data Factory et One Lake. Cette intĂ©gration est incarnĂ©e par une technologie de mirroring pour ingĂ©rer des collections de donnĂ©es stockĂ©es dans MongoDB Atlas sur One Lake au format Parquet, Ă  l’aide d’une approche de rĂ©plication incrĂ©mentale, en batch ou en microbatch pour des analyses en « presque Â» temps rĂ©el.

« Les Ă©vĂ©nements d’insertion, de mise Ă  jour et de suppression se produisant sur la collection MongoDB Atlas source seront reflĂ©tĂ©s sur la table OneLake cible en temps quasi rĂ©el. La conversion du format en Parquet, les conversions de type de donnĂ©es et la gestion des changements de schĂ©ma sont toutes gĂ©rĂ©es par la mise en miroir Â», prĂ©cise MongoDB, dans un billet de blog.

Il faut ensuite dĂ©ployer un point de terminaison SQL Analytics afin de requĂŞter les donnĂ©es (avec T-SQL) dans la collection Mongo. En outre, un modèle sĂ©mantique « par dĂ©faut Â» est gĂ©nĂ©rĂ© par la procĂ©dure afin de crĂ©er des rapports Power BI.

« Nos clients ont manifestĂ© un grand intĂ©rĂŞt pour les fonctionnalitĂ©s proposĂ©es autour de Fabric, particulièrement en raison de sa capacitĂ© Ă  intĂ©grer plusieurs outils comme Power BI et Synapse, tout en soutenant divers cas d’usage et en offrant une gouvernance globale des donnĂ©es Â», affirme FrĂ©dĂ©ric Favelin. « Beaucoup se demandaient comment exploiter des donnĂ©es issues de sources comme MongoDB et mettre en Ĺ“uvre une telle architecture Â».

Il ne s’agit pas, pour autant, de rĂ©pliquer l’entièretĂ© d’une base de donnĂ©es Mongo, prĂ©cise FrĂ©dĂ©ric Favelin, mais des collections utiles au cas d’usage cible.

Jusqu’alors, pour arriver au mĂŞme rĂ©sultat, il fallait s’appuyer sur ADLS Gen 2 et le moteur de traitement Apache Spark. « Cette approche Ă©tait perçue comme complexe par certains utilisateurs. Les clients attendaient donc avec impatience une solution plus gĂ©nĂ©rique, dont les bases avaient Ă©tĂ© annoncĂ©es l’annĂ©e prĂ©cĂ©dente Â», poursuit le responsable.

Cette intĂ©gration intĂ©resse plus particulièrement les entreprises cherchant Ă  motoriser des usages de BI, d’IA et de ML dans un contexte opĂ©rationnel, par exemple des acteurs de la logistique, de la distribution (retail) ou de l’industrie manufacturière. « Tous clouds confondus, nous avons Ă©galement des discussions avec des spĂ©cialistes des soins de santĂ© Â», assure FrĂ©dĂ©ric Favelin.

Le troisième volet du partenariat tient dans la disponibilité de MongoDB Enterprise Advanced (EA) sur Azure Marketplace, mais pour déployer cette distribution commerciale self-managed sur l’environnement Kubernetes d’Azure Arc, c’est-à-dire en cloud hybride.

« Notre objectif, c’est d’aider les dĂ©veloppeurs Ă  dĂ©ployer notre technologie et leurs applications oĂą ils le souhaitent : sur site, dans le cloud, en mode multicloud ou hybride Â», assure FrĂ©dĂ©ric Favelin.

Ici, il s’agit plus particulièrement de s’appuyer sur l’opérateur Kubernetes spécifique à MongoDB Enterprise qui faciliterait les déploiements. Dans le cas présent, la console cloud d’Azure devient le control plane d’Azure Arc et du SGBD associé.

Favoriser les migrations vers MongoDB Atlas sur Azure

Enfin, et c’est sans doute le point le plus important du partenariat qui n’est pas Ă©voquĂ© par Microsoft, MongoDB monte un programme commun avec le gĂ©ant de Redmond accolĂ© Ă  Microsoft Cloud Migration Factory (CMF). Son nom ? MongoDB Migration Factory.

Ici, il s’agit d’accompagner les clients des Ă©ditions Enterprise Advanced, souvent de grands comptes, et les utilisateurs de l’édition communautaire de MongoDB (plus de 100 millions de tĂ©lĂ©chargements par an, selon FrĂ©dĂ©ric Favelin) Ă  migrer vers MongoDB Atlas sur Azure (disponible sur 48 rĂ©gions cloud Azure). « Le grand intĂ©rĂŞt de ce programme c’est que les ingĂ©nieurs de MongoDB et de Microsoft peuvent fournir du “clĂ© en main” : ils automatiseront une partie de la migration et guideront le client avec les bonnes pratiques Â», avance le responsable chez MongoDB.

« Nous avons rĂ©alisĂ© des milliers de projets clients avec le modèle CMF sur l’ensemble des charges de travail Azure, ce qui en fait une approche Ă©prouvĂ©e pour accĂ©lĂ©rer les transitions vers le cloud grâce Ă  une prestation gĂ©rĂ©e par Microsoft Â», dĂ©clare Rashida Hodge, vice-prĂ©sidente Corporate d’Azure Data et AI chez Microsoft, dans un billet de blog.

De manière gĂ©nĂ©rale, les intĂ©grations avec les fournisseurs cloud sont importantes pour MongoDB. Ă€ la fin du deuxième trimestre fiscal 2025 terminĂ© le 31 juillet 2024, l’offre SaaS Atlas reprĂ©sentait 71 % des revenus totaux de l’éditeur (478 millions de dollars au Q2 2025). L’éditeur ne prĂ©cise pas toutefois la part de revenu associĂ© aux diffĂ©rents clouds.

Du côté de Microsoft, ce partenariat approfondi avec MongoDB semble représenter un changement de braquet. Jusqu’alors, le géant du cloud a tenté de convertir les utilisateurs du SGBD NoSQL à CosmosDB, en l’agrémentant de diverses fonctions similaires, sans toutefois y aller aussi franchement qu’Oracle.

C’était avant Microsoft Fabric, selon FrĂ©dĂ©ric Favelin. « L’objectif de Microsoft avec Fabric, c’est de faire converger les donnĂ©es de ses clients, ainsi que leurs charges de travail analytiques et d’IA sur une seule plateforme. Et ils se sont rendu compte que, pour ce faire, il faut ĂŞtre ouvert Â».

Il n’est pas uniquement question de MongoDB, mais de l’ensemble des SI des entreprises. Fabric dispose de connecteurs pour ingérer les données depuis SAP BW/HANA, Snowflake, Teradata, Google BigQuery, Amazon RedShift, Oracle Database, etc. « En fin de compte, l’objectif de Microsoft est d’encourager ses clients à utiliser son infrastructure », note Frédéric Favelin.

Pour approfondir sur Base de données