Dataiku entend centraliser la gestion des projets d’IA agentique
S’il accuse un petit retard à l’allumage, l’éditeur d’origine française entend prouver qu’il peut prendre en charge à l’échelle les cas d’usage de l’IA agentique.
Publié le: 29 avr. 2025
Selon l’éditeur, 20 % de ses 700 clients (environ 140, donc) utilisent sa plateforme pour intégrer l’IA générative dans des flux de travail. Depuis l’année dernière, ils auraient collectivement déployé plus de 1 000 cas d’usage actifs.
Des agents IA « no-code » et « pro-code »
Pour suivre cette croissance, Dataiku entend fournir des outils no-code (Visual Agent) et pro-code (Code Agent).
Visual Agent n’est autre que l’adaptation des mécanismes WYSIWYG de la plateforme à l’IA générative. Une UI permet ensuite d’écrire ou de copier-coller le prompt qui guidera les actions de l’agent. Les administrateurs peuvent configurer les accès à Claude, Azure OpenAI, Claude via Amazon Bedrock, La Plateforme de Mistral, OpenAI et Google Vertex AI pour l’appel de fonction. La plateforme est également compatible avec Databricks et Snowflake, Hugging Face et les modèles autohébergés. En revanche, la documentation ne précise pas comment configurer Visual Agent pour ces sources de LLMs.
Pour le reste, l’usager retrouve les sources de données et les outils argentiques auxquels il a accès. Code Agent laisse le choix des armes entre certains outils gérés par Dataiku (API Google Search et Azure AI Search, lookup sur les données, requêtes SQL, appel à des modèles prédictifs, etc.) et le framework open source LangChain. Code agent permet surtout aux développeurs d’exécuter le code des agents dans des conteneurs managés par l’éditeur, d’effectuer des requêtes en parallèle et d’auditer les appels de fonction vers les LLM.
Il est également possible, à partir d’un template, de créer des plugins personnalisés (custom tool) dont le code et les accès peuvent être gérés depuis la plateforme. De même, comme les agents sont traités en tant que projets au sein de Dataiku, la suite permet de visualiser les agents IA et d’obtenir une fiche qui renseigne sur leurs objectifs et les risques qu’ils représentent. Bref, Dataiku entend proposer un hub pour la coordination multiagent.
En outre, un mécanisme permet de conditionner l’exécution partielle ou complète des flux de travail agentique. L’éditeur propose aussi un mécanisme d’évaluation (Quality Guards) à l’aide d’un LLM-as-Judge. Celui-ci permet de concevoir des jeux de données de vérifications et les éléments de vérité terrain (des données correspondant aux réponses et/ou comportements attendus).
En sus des fonctions Cost Guard (FinOps) et Guardrails (garde-fous) existantes, Dataiku met l’accent sur son explorateur de trace. Considérant que la nature non déterministe des LLM peut les pousser à halluciner et que les agents sont amenés à manipuler une collection d’outils, l’éditeur estime qu’ils sont difficiles à suivre.
Pour y remédier, Dataiku propose un « système de traçage complet » qui enregistre « la trace de ce que fait l’agent, même à travers de multiples couches d’appels LLM », assure l’entreprise, dans sa documentation. « La trace est disponible sous la forme d’un objet JSON imbriqué montrant les étapes du traitement et les événements ».
L’explorateur de trace est une application Web permettant de visualiser ces appels, à l’instar d’un outil d’observabilité. Il est aussi possible de faire correspondre les appels à un diagramme de l’architecture de l’application.
Agent Connect, une évolution de Dataiku Answers
Dans cette logique multiagent, Agent Connect est une application reliée au hub décrit plus haut. Cette UI doit permettre de servir de « point d’entrée unique pour des agents bâtis dans Dataiku ». Ce système gérerait automatiquement le routage, les permissions et les échanges entre les agents.
En clair, les agents sont considérés comme des plugins de l’outil Dataiku Answers qui sélectionne le bon candidat suivant la question. Les administrateurs doivent choisir le LLM « principal » qui guidera la conversation. Il est aussi possible de s’appuyer sur des accès à des bases de données structurées ou de faire appel à des LLM multimodaux pour traiter des documents et des images chargés par l’utilisateur. Le système permet de configurer la visibilité des chunks sélectionnés par le potentiel dispositif RAG associé et le code SQL généré. En parlant de RAG, la version 13.5 de DSS ajoute la prise en charge des recettes de vectorisation pour Azure AI Search, Pinecone et ChromaDB.
Les autres éléments de la mise à jour portent sur la prise en charge améliorée des prédictions time series et des traitements in-database Teradata, GreenPlum et MongoDB ou « in-volume » sur Databrick et Snowflake.
Tenter de se distinguer sur un marché effervescent
Sur le papier, la solution de Dataiku semble plutôt complète. L’année dernière, plusieurs utilisateurs de la plateforme ont indiqué au MagIT que leur entreprise n’avait pas eu recours à Dataiku pour leurs projets d’IA générative, car des briques technologiques manquaient à l’appel. L’éditeur semble avoir rattrapé son retard. Les derniers avis – pour la plupart très positifs – sur Gartner Peer Insights saluent plutôt la capacité de DSS à centraliser et à simplifier la gestion des projets analytiques, des étapes de préparations de données et des processus ETL, ainsi que les fonctions de machine learning.
C’est sur les mêmes ressorts que souhaite s’appuyer Dataiku pour convaincre les entreprises de créer et gérer leurs agents depuis sa plateforme.
« À mesure que les entreprises passent de l’exploration à l’opérationnalisation des agents, elles prennent conscience de la nécessité de centraliser leurs créations pour une bonne gouvernance plutôt que de les laisser se disperser ; d’optimiser continuellement leurs performances au lieu de les laisser s’éroder ; et de les orchestrer entièrement par le biais des actifs informatiques existants au lieu d’augmenter leur dette technologique », déclare Florian Douetteau, cofondateur et PDG de Dataiku, dans un communiqué de presse. « C’est précisément ce que nous intégrons aujourd’hui à notre plateforme ».
« L’entreprise a-t-elle déjà atteint cet objectif ? », s’interroge Brad Schimmin, vice-président et responsable des pratiques de gestion de données et analytique chez Futurum Group, dans un billet de blog. « En matière de portée et de positionnement, oui ».
« Ce nouvel outil […] n’aborde pas encore les nouveaux domaines d’intérêt, tels que la gestion des traces générées avant le résultat créé par un modèle de raisonnement. »
Brad SchimminV-P et responsable des pratiques de gestion de données et analytique, Futurum Group
Néanmoins, « l’entreprise a encore du travail d’ingénierie à faire pour que sa nouvelle boîte à outils agentique arrive à maturité », nuance-t-il.
L’analyste évoque principalement les fonctions de traçage. « Ce nouvel outil sert principalement de tableau de bord pour des éléments de transactions existants. Il n’aborde pas encore les nouveaux domaines d’intérêt, tels que la gestion des traces générées avant le résultat créé par un modèle de raisonnement », note-t-il.
Sur le marché, la suite de Dataiku se distingue par son plus grand agnosticisme au regard de l’infrastructure. Cet argument ne tient plus vraiment vis-à-vis des fournisseurs de LLM : pratiquement tous les éditeurs et fournisseurs misent sur des catalogues de modèles. En revanche, les endroits pour créer et gérer des agents en dehors des applications métiers (SAP, Workday, Salesforce, ServiceNow, etc.) ne manquent pas. Snowflake, Databricks, AWS, Microsoft, Google Cloud sont quelques-uns des acteurs portant cette volonté. AWS et Google Cloud ont déjà des clients d’envergure ayant fait le choix de leur plateforme pour ce faire. C’est le cas de Veolia qui a bâti son catalogue d’agents IA sur la base des services AWS. Pour Brad Schimmin, c’est justement ce qu’il faut surveiller. La manière dont Dataiku se distinguera sur un marché « encombré », dont il prendra en charge les nouvelles pratiques et les frameworks liés à l’IA agentique, déterminera la pertinence de son offre.
Pour approfondir sur IA appliquée, GenAI, IA infusée