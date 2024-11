Le 19 novembre, lors de MongoDB Local Paris, qui se tenait en parallèle de Microsoft Ignite 2024 à Chicago, l’éditeur du SGBD NoSQL éponyme a annoncé un partenariat avec le fournisseur de cloud.

Gartner, Deloitte, BCG X et d’autres s’entendent sur une chose : bien qu’une majorité d’entreprises ont testé l’IA générative, une minorité d’entre elles l’on fait ont déployé en production. Entre mai et juin 2024, Deloitte a mené une étude auprès de 2770 participants. « De nombreux efforts en matière d’IA générative en sont encore au stade du projet pilote ou de la validation de concept », constate Deloitte. « Une grande majorité des personnes interrogées (68 %) déclare que leur organisation a fait passer 30 % ou moins de ses expériences d’IA générative en phase de production ».

« Aujourd’hui, l’intégration native avec Azure AI Studio offre aux clients la possibilité de concevoir rapidement des applications en utilisant quelques lignes de code, des API, et leurs propres données », affirme Frédéric Favelin, Global Head Cloud Partner Solutions Architect chez MongoDB. « Cela représente un gain considérable en temps et en efficacité, particulièrement dans le développement d’applications comme des chatbots, des copilotes ou des solutions internes ».

Sans surprise, il est question d’IA générative. Ainsi, la DBaaS MongoDB Atlas s’intègre avec Azure OpenAI Service et son chapeau Azure AI Foundry. Atlas peut alors servir de base de données vectorielle afin de propulser des applications de type RAG (Retrieval Augmented Generation) en lien avec les services et produits Microsoft.

Favoriser les usages de Microsoft Fabric

Le partenariat entre Microsoft Azure et MongoDB couvre surtout l’intégration d’Atlas avec Microsoft Fabric, la suite de traitement de données concurrente de Databricks et Snowflake. Elle rassemble Azure Synapse (ex-SQL Data Warehouse), Data Factory et One Lake. Cette intégration est incarnée par une technologie de mirroring pour ingérer des collections de données stockées dans MongoDB Atlas dans One Lake au format Parquet à l’aide d’une approche de réplication incrémentale, en batch ou en microbatch pour des analyses en « presque » temps réel.

« Les événements d’insertion, de mise à jour et de suppression se produisant sur la collection MongoDB Atlas source seront reflétés sur la table OneLake cible en temps quasi réel. La conversion du format en Parquet, les conversions de type de données et la gestion des changements de schéma sont toutes gérées par la mise en miroir », précise MongoDB, dans un billet de blog.

Il faut ensuite déployer un point de terminaison SQL Analytics afin de requêter les données (avec T-SQL) dans la collection Mongo. En outre, un modèle sémantique « par défaut » est généré par la procédure afin de créer des rapports Power BI.

« Nos clients ont manifesté un grand intérêt pour les fonctionnalités proposées autour de Fabric, particulièrement en raison de sa capacité à intégrer plusieurs outils comme Power BI et Synapse, tout en soutenant divers cas d’usage et en offrant une gouvernance globale des données », affirme Frédéric Favelin. « Beaucoup se demandaient comment exploiter des données issues de sources comme MongoDB et mettre en œuvre une telle architecture ».

Il ne s’agit pas, pour autant, de répliquer l’entièreté d’une base de données Mongo, précise Frédéric Favelin, mais des collections utiles au cas d’usage cible.

Jusqu’alors, pour arriver au même résultat, il fallait s’appuyer sur ADLS Gen 2 et le moteur de traitement Apache Spark. « Cette approche était perçue comme complexe par certains utilisateurs. Les clients attendaient donc avec impatience une solution plus générique, dont les bases avaient été annoncées l’année précédente », poursuit le responsable.

Cette intégration intéresse plus particulièrement les entreprises cherchant à motoriser des usages de BI, d’IA et de ML dans un contexte opérationnel, par exemple des acteurs de la logistique, de la distribution (retail) ou de l’industrie manufacturière. « Tous clouds confondus, nous avons également des discussions avec des spécialistes des soins de santé », assure Frédéric Favelin.

Le troisième volet du partenariat tient dans la disponibilité de MongoDB Enterprise Advanced (EA) sur Azure Marketplace, mais pour déployer cette distribution commerciale self-managed sur l’environnement Kubernetes d’Azure Arc, c’est-à-dire en cloud hybride.

« Notre objectif, c’est d’aider les développeurs à déployer notre technologie et leurs applications où ils le souhaitent : sur site, dans le cloud, en mode multicloud ou hybride », assure Frédéric Favelin.

Ici, il s’agit plus particulièrement de s’appuyer sur l’opérateur Kubernetes spécifique à MongoDB Enterprise qui faciliterait les déploiements. Dans le cas présent, la console cloud d’Azure devient le control plane d’Azure Arc et du SGBD associé.