MongoDB 8.2 : la recherche vectorielle et l’IA agentique arrivent sur site

Si MongoDB mise encore et toujours sur sa DbaaS Atlas, il veut continuer de prouver à ses clients on-premise qu’il ne les abandonne pas, même à l’heure de l’IA agentique. L’apport de la recherche vectorielle dans une version mineure et d’un serveur MCP self-hosted fait partie de cet engagement.

MondoDB a profité de son événement « local » new-yorkais pour présenter les ajouts incrémentaux à sa base de données NoSQL et à sa plateforme DBaaS, MongoDB Atlas.

Fidèle à son approche, l’éditeur poursuit son effort consistant à offrir une équivalence fonctionnelle pour des capacités clés d’abord introduites dans son offre cloud.

Le stockage de vecteurs et la recherche vectorielle en font désormais partie. Ces briques essentielles à l’émergence du mécanisme RAG sont prises en charge par la majorité des fournisseurs de SGBD.

Au tour des éditions « self-managed » – Community et Enterprise Advanced – de MongoDB d’en bénéficier.

La recherche vectorielle « on premise »

Plus précisément, la version mineure 8.2 de MongoDB est l’occasion de proposer le stockage des vecteurs et l’algorithme de recherche associée en préversion publique. Certains partenaires, dont le fournisseur de cloud français Scaleway, participaient déjà à la préversion privée de cette technologie. Scaleway espère le livrer à ses clients en disponibilité générale avant la fin de l’année.

MongoDB rappelle de son côté que cette fonctionnalité peut être combinée avec les composants de recherche plein texte et sémantique dans un mode « hybrid search ». Dans la même veine, MongoDB adapte ses mécanismes d’indexation et de mise en cache des documents en leur allouant une quantité de RAM par défaut au démarrage.

Le sharding a été revu pour éviter les résultats incohérents après une migration de données. Un paramètre termine les opérations de lecture longue durée sur les nœuds secondaires avant la suppression d’un document orphelin. La version 8.0 avait déjà été l’occasion pour l’éditeur de rapporter des gains de performance significatifs.

Techniquement, comme le remarquent les analystes, MongoDB « déroule son programme ». Commercialement, les clients d’Enterprise Server doivent s’attendre à des changements. À la disponibilité générale de la recherche vectorielle, l'entreprise américaine proposera une « nouvelle offre de souscription payante » dont les détails seront révélés un peu avant le lancement.

Un serveur MCP pour les développeurs et les agents IA

La mise à disposition de ces fonctionnalités serait également nécessaire pour constituer une « mémoire à long terme pour les agents IA ».

En parlant d’agents, MongoDB évoque ses partenariats avec LangChain et LlamaIndex, les deux éditeurs derrière les frameworks GenAI éponymes.

Mais il annonce surtout la disponibilité générale de son serveur MCP. Celui-ci peut être déployé sur site ou dans le cloud. Il se connecte à Atlas ou aux éditions Enterprise Advanced et Community.

Pour rappel, c’est un composant du framework open source Model Context Protocol, lancé en novembre 2024 par Anthropic. MCP doit standardiser la manière dont les grands modèles de langage (LLM) interagissent avec les sources de données et les outils d’une entreprise. Google Cloud, Microsoft, Oracle, Databricks, Snowflake, ou encore Informatica sont quelques-uns des acteurs qui prennent en charge cette technologie. Couchbase et Redis, deux concurrents directs de MongoDB, ont également fait de même.

Le serveur MCP de MongoDB est compatible avec les mécanismes d’authentification OIDC, LDAP et Kerberos. Il est également possible de l’associer à un proxy.

Ce serveur est conçu pour être connecté aux clients MCP de Claude Code, Cursor, Visual Studio Code et de Windsurf. Il permet d’exécuter des opérations dans Atlas (lister des clusters, créer un profil utilisateur, etc.), mais également dans la base de données (lister des collections de documents, décrire leur schéma, exécuter une agrégation, générer une requête, etc.).

L’éditeur se rapproche aussi de N8N et CrewAI, deux plateformes agentiques. De la sorte, les agents créés avec ces outils peuvent appeler des vecteurs stockés dans Mongo.

Interrogés par une publication sœur du MagIT, les analystes Kevin Petrie de BARC US et Stephen Catanzano d’ESG (une filiale d’Omdia) considèrent que l’ensemble de ces fonctionnalités répondent aux demandes des clients. MongoDB pourrait toutefois fournir des efforts pour renforcer la gouvernance des données et ajouter des moyens contrôles des agents IA. De même, ils estiment que l’apport de templates et d’architectures de référence pour des acteurs de différents verticaux pourrait simplifier les déploiements de solutions d’IA.

Reste à voir si MongoDB s’engagera dans ces deux voies, potentiellement couvertes par ses partenaires. Par exemple, il a décidé d’abandonner le support commercial de Realm et des modules Atlas associés. Ils seront supprimés le 30 septembre 2025. Cette technologie est utilisée pour coordonner des informations entre des bases de données mobiles/Web et une plateforme centrale. L’éditeur s’appuie désormais sur le moteur de synchronisation de son partenaire PowerSync (base SQLite) pour couvrir certains scénarios mobile et Edge.

L’IA infuse le programme de migration vers MongoDB Atlas

LangChain, LlamaIndex, N8N, CrewAI demeurent des outils populaires chez les développeurs. Ce sont, avec les membres des directions techniques, les interlocuteurs privilégiés de MongoDB.

Or, depuis deux ans, l’éditeur se pose en partenaire des entreprises dans leurs projets de modernisation applicative. D’où le lancement d’Application Modernization Platform (AMP). Cette offre de migration comprend un accompagnement par des ingénieurs de MongoDB, une méthodologie spécifique et des outils propriétaires infusés à l’IA.

MongoDB explique que les LLM à eux seuls ne suffisent pas pour analyser de grandes bases de code et peuvent générer du code buggé. Au lieu de cela, le fournisseur exploite cette technologie par petites touches à différentes phases de son programme. L’IA sert à formuler des exigences techniques, créer des prototypes, automatiser la documentation, exécuter des tests unitaires et évaluer les performances. D’autres outils de MongoDB tracent les interactions entre une application et sa base de données, analysent les données à migrer et les convertissent. Et l’éditeur d’assurer qu’il peut le faire pour des applications s’appuyant sur des bases de données orientées documents ou relationnelles.

Surtout, il affirme que cet effort de modernisation est la condition sine qua non à l’adoption de l’IA agentique.  

« Au cours des deux dernières années, nous avons aidé des clients issus de divers secteurs à migrer et à moderniser leurs outils existants vers des applications modernes fondées sur MongoDB », déclare Silpha Kolhar, vice-présidente senior des produits et de l’ingénierie chez MongoDB, lors d’une conférence de presse. « Nous pensons que le moment est venu d’aider nos clients, où qu’ils se trouvent, à se préparer à adopter les nouvelles technologies d’IA ».

C’est surtout, à première vue, un moyen pour l’entreprise new-yorkaise d’étendre l’empreinte de ses services chez ses clients.

L’interrogation des champs chiffrés prête en production en 2026

En ce sens, la version 8.2 de son SGBD NoSQL est l’occasion d’un changement de politique. Alors que les clients déployant la base de données sur site ou en cloud privé n’avaient le droit qu’aux versions majeures, l’éditeur a décidé de rendre accessibles les versions mineures. Il s'agit de tester le comportement de certaines fonctionnalités « spécifiques », dont la recherche vectorielle.

Une autre capacité phare justifie cette décision : l’interrogation de champs de données chiffrées. C’est une des features « star » de MongoDB 7.0, introduite à partir de la 6.0 (il est possible de chiffrer des champs de données depuis la 4.2).

Après « range », MongoDB 8.2 prend en charge les requêtes par suffixe, préfixe et sous-chaîne (substring) en préversion publique.

Selon MongoDB, cela permet aux « applications de chiffrer des éléments confidentiels comme des noms, des adresses, des notes ou des numéros d’identification tout en continuant à effectuer des recherches par correspondance partielle native sur les données chiffrées ».

Et de présenter des exemples en matière de conformité réglementaire, d’investigation de cas prioritaires à traiter par le support sans exposer les données des clients dans les notes associées, de protection des données sensibles pour des agences gouvernementales ou des entreprises considérées comme des OIV.

MongoDB précise toutefois que le comportement des requêtes de données chiffrées n’est pas encore assez stable pour un usage en production. Il faudra attendre la disponibilité générale, prévue au cours de l’année 2026.  

Pour approfondir sur Base de données