
Kiattisak - stock.adobe.com
Opendatasoft ouvre sa plateforme aux agents IA
Si sa priorité demeure la constitution de places de marché de données ouvertes ou fermées, l’éditeur français ne peut pas passer à côté des enjeux en matière d’IA de ses clients. Son serveur MCP est un nouvel outil dans son arsenal pour tenter d’y répondre.
Par la modernisation de sa plateforme, Opendatasoft, vise deux objectifs. Il souhaite en simplifier l’expérience utilisateur et l’adapter au développement de différents types de places de marchés.
« L’essentiel des discussions avec nos clients entreprises concerne les produits de données et les marketplaces internes », relate David Thoumas, directeur technique et cofondateur d’Opendatasoft. « Du portail ouvert, nous avons décliné notre offre pour prendre en charge les places de données internes et celles consacrées aux espaces de données servant les besoins d’un écosystème ».
Cela passe, entre autres, par des ajustements de son socle technique. Après le lancement de ses API en v2.1, en 2024, il a poursuivi l’amélioration des fonctions de lignage de données entamées l’année précédente. Opendatasoft a finalisé l’infusion de son moteur de recherche basée sur Elasticsearch. Cette année, il s’est penché sur la recherche au sein des jeux de données, après avoir intégré la recherche vectorielle.
Par ailleurs, il est possible d’exporter les jeux de données au format Parquet, en sus de se connecter à Azure SQL. L’éditeur ne limite plus la jointure de tables à des fichiers de moins de 100 000 lignes.
C’est dans cette même logique qu’Opendatasoft revoit progressivement l’interface utilisateur de différentes briques de sa plateforme. L’année dernière, il a simplifié la gestion visuelle des schémas. En 2025, il a modifié l’UI des processeurs et des formulaires de collectes de données. Sans oublier les exigences de sécurité : l’authentification multifacteur est accessible depuis le 11 juin.
Son autre enjeu est commun à tous les éditeurs de gestion de données : l’IA.
En octobre dernier, il a dévoilé une fonctionnalité de création de cartes et de visuels basés sur un modèle de Mistral AI ou d’OpenAI. Opendatasoft utilise les modèles d’embedding de ces deux fournisseurs pour sa recherche vectorielle.
« Nous avons intégré cette fonctionnalité de recherche sémantique sans surcoût pour nos clients », affirme David Thoumas. « Dans notre activité liée aux places de marché d’interne, où il y a souvent du jargon, un vocabulaire spécifique. La recherche sémantique change la donne ».
Opendatasoft a aussi présenté la génération de vues tabulaires à l’aide des mêmes modèles d’IA. Il souhaite désormais faire de sa plateforme un socle pour les déploiements d’agents IA. L’occasion pour lui d’introduire la préversion d’un serveur MCP.
Un serveur MCP pour exposer les fonctions API d’Opendatasoft aux modèles d’IA
Pour rappel, MCP (Model Context Protocol) est un protocole de communication ouvert proposé par Anthropic afin de confier aux grands modèles de langage des outils pour rechercher ou manipuler des données et des fonctions.
« Même si les LLM sont très perfectibles, nous commençons à être capables de connecter les IA au monde réel, physique et numérique, ce qui ouvre un large panel de cas d’usage », estime le directeur technique d’Opendatasoft. « De notre côté, nous souhaitons déterminer comment les agents IA et aux applications peuvent profiter de notre plateforme ».
Dans cette préversion, le serveur MCP expose quatre outils/fonctions issus de l’API Explore v2.1 d’Opendatasoft. Le LLM peut ainsi accéder à la documentation de l’API, rechercher des jeux de données, filtrer les données qu’ils incluent et les exporter.
Lors de sa démonstration, le directeur technique a pu interroger Claude Opus 4 d’Anthropic à partir de Claude Desktop sur les données contenues dans un portail privé.
« Le LLM peut exploiter plusieurs fonctionnalités de notre API, dont la recherche par mot-clé, la recherche sémantique et l’écriture de requêtes ODSQL », explique David Thoumas.
Pour l’instant, Opendatasoft privilégie l’usage des modèles et l’application d’Anthropic. « Nous sommes en train de tester notre serveur MCP avec des modèles OpenAI et Copilot dans Teams de Microsoft. Actuellement, en matière de raisonnement, de qualité de résultats et de compréhension de notre plateforme, les modèles Claude sont meilleurs », constate le CTO.
Le serveur MCP sera in fine ouvert aux LLM et aux applications d’éditeurs tiers. « L’idée, c’est que nos clients puissent choisir leur modèle de prédilection ».
Un effort à faire sur la mise en qualité de données
David Thoumas envisage que cette prolifération des usages de l’IA réclame d’ajuster la qualité des données.
« Je pense que les organisations sont prêtes à accepter l’IA comme un moyen d’augmenter les capacités des humains. Le seul “truc” qui n’est pas forcément prêt, ce sont les données », commente-t-il. « Plus les données sont documentées, meilleurs seront les résultats du LLM ».
Les clients d’Opendatasoft les plus avancés en matière d’IA générative seraient en train d’effectuer ce travail de documentation. Ils sont encore minoritaires.
« Notre enjeu sera aussi de développer des agents IA au sein du back-office de la plateforme pour aider nos clients à créer du contenu, expliquer les métadonnées, engendrer ou enrichir les descriptions existantes, les standardiser, etc. », ajoute David Thoumas.
Que ce soient les appels aux LLM ou aux agents IA, Opendatasoft entend tracer les interactions avec ses portails et ses API. Outre la nécessaire piste d’audit qu’il doit fournir à ses clients, l’éditeur imagine pouvoir ainsi confier davantage d’informations aux administrateurs afin de comprendre l’usage des actifs de données référencés sur les portails.
« Nous avons déjà des moyens pour analyser les usages des données par les métiers sur notre plateforme et nous allons continuer de développer cet aspect concernant les IA », anticipe David Thoumas. « Un volet qui est finalement peu évolué chez nos concurrents et partenaires technologiques ».
Ces informations pourraient ensuite servir à mieux mettre en valeur les actifs de données les plus pertinents.
Dans un même temps, Opendatasoft entend exposer les API de création de contenu – jeux de données, visualisations, descriptions, etc. – via son serveur MCP.
« Les administrateurs et les producteurs de données à qui nous avons présenté notre serveur MCP et notre feuille de route sont enthousiastes à l’idée d’augmenter leur capacité », assure David Thoumas.
Néanmoins, il y a encore des ajustements à faire du côté des contributeurs d MCP, notamment dans la gestion des rôles et des accès. « Pour l’instant, nous exposons une clé d’API au LLM, ce qui n’est pas la solution la plus idéale en matière de sécurité. Nous allons fournir quelque chose de plus sophistiqué, sûrement basé sur des tokens éphémères de type JWT, mais pour cela il faut que le protocole mûrisse un peu », estime le CTO. De fait, la prise en charge d’Oauth 2, le standard utilisé par Opendatasoft, pose encore problème.