Agents IA : Dataiku cherche l’équilibre entre simplicité et gouvernance

Dataiku poursuit le développement de ses fonctions agentiques. Plus lent au démarrage que ses concurrents, il a bien compris qu’il faut peaufiner l’intégration des agents IA dans les processus métier. Et s’assurer une forme de simplicité tout en renforçant la gouvernance.

L’acteur franco-américain tient, cette semaine, son événement Dataiku Summit Paris. S’il fait la part belle aux retours d’expérience de ses clients, l’éditeur ne manque pas de rappeler sa feuille de route. Sans surprise, l’éditeur a d’abord présenté ses futures capacités agentiques.

En la matière, Dataiku n’est pas le plus en avance. Ses clients non plus, il faut dire. Mais l’éditeur dit avoir bien pris note de leurs remarques.

Clément Stenac, cofondateur et CTO de Dataiku, évoque trois piliers de développement : l’orchestration de capacités d’IA agentique, leur intégration dans les processus métier et l’opérationnalisation de la gouvernance de l’IA.

L’éditeur développe depuis un an un studio de développement d’agents IA basé sur son écosystème LLM Mesh. Il proposait déjà des intégrations avec les outils de sa plateforme et vers les solutions externes, dont ServiceNow, Snowflake, Sharepoint, Vertex AI ou encore Salesforce. En octobre, il ajoutera la connexion vers les serveurs MCP « sur étagère, fournie par des éditeurs tiers ou ceux déployés en interne ».

« Prochainement », Dataiku entend améliorer la conception « visuelles » d’agents ou d’assistants IA « simples ».

Les métiers pourront sélectionner un LLM, ajouter des documents, appeler des outils et des agents IA déjà configurés par des développeurs ou d’autres métiers. L’interface permettra d’écrire des instructions ou en choisir parmi des templates de prompts, puis tester l’assistant IA avant de le déployer. Une fonction de génération de slides sera mise à leur disposition. À terme, ils pourront vérifier la nature des requêtes SQL exécutées par l’assistant, ainsi que les données sources.

Agent Hub, un portail d’accès aux agents IA

L’idée est de pouvoir créer une bibliothèque où les entreprises pourront cataloguer leurs agents, permettre à leurs employés d’en créer des variantes. Ces agents IA pourront être partagés avec le reste de l’entreprise. Cet Agent Hub sera disponible au mois d’octobre.

Certaines entreprises ont développé des fonctionnalités similaires en propre. C’est le cas de Veolia ou d’AG2R. Pour autant, Dataiku veut se différencier avec un flux de contrôle et de gouvernance de bout en bout.

En sus des fonctions de tests au moment du développement, à travers le volet Govern de la plateforme Dataiku, les projets des ingénieurs peuvent être soumis à une phase d’analyse de risque et de valeur. « Nous proposons également une capacité de “signature” », indique Clément Stenac. Des responsables des risques et de l’IT revoient les étapes de conception. Ils s’assurent que l’agent IA respecte les lois en vigueur, les règles internes de l’entreprise et de l’IT avant sa mise en production.

« Dans ce flux, nous ferons prochainement intervenir des experts métiers au sein du cycle de développement afin de créer des tests, des validations raccord avec leurs besoins », ajoute Clément Stenac. Il s’agit de mettre en place « une boucle de réaction entre les métiers et les développeurs ».

En outre, une capacité d’évaluation continue des agents IA est en cours de développement. Il s’agit de pouvoir détecter les dérives, à l’instar des algorithmes de machine learning. Le directeur technique n’a toutefois pas détaillé comment il comptait faire. Généralement, ces tests sont effectués en amont de la mise en production des applications GenAI.

En tout cas, cette approche suit une logique historique chez Dataiku. Les métiers pourront développer de « petits » agents en s’appuyant sur des briques agentiques configurées par des ingénieurs. Des éléments validés par la DSI et le DPO. Par ailleurs, les administrateurs auront accès aux logs d’audit d’Agent Hub.

« Cela reste sous le contrôle de l’IT. Ces fonctionnalités peuvent être intégralement déployées au sein de votre SI en mode air-gapped, puisque Dataiku supporte les modèles locaux avec des capacités de supervision, d’audit, etc. », souligne Clément Stenac.

Unifier la gouvernance des données et des IA au-delà de Dataiku

L’intervention d’un plus grand nombre de rôles et de cas d’usage pousse Dataiku à automatiser et à étendre la gouvernance de sa plateforme.

« Actuellement, quand un responsable du risque étudie un projet ou un objet afin d’y appliquer la bonne politique de gouvernance, il le fait manuellement », signale le directeur technique. « Cette sélection manuelle est source de frictions ».

D’où la volonté d’apporter des flux de sélection guidés ou automatiques basés sur des règles, mais aussi de les appliquer sur des plateformes tierces.

« La gouvernance dans Dataiku est jusqu’à présent centrée sur ce que vous faites dans la plateforme », reconnaît Clément Stenac. « Notre but est d’unifier l’application de ces règles de gouvernance non seulement pour des modèles d’IA, des flux analytiques, des agents développés dans Dataiku, mais également dans d’autres plateformes ». Et d’afficher sur un slide les logos de Databricks, Google Vertex AI, Amazon Sagemaker, Snowflake et d’Azure.

Plus de fonctionnalités spécifiques à certains métiers

Dataiku continue d’infuser l’IA générative dans le reste de sa plateforme. Outre la génération de métadonnées déjà disponibles, l’éditeur introduira un assistant de conception de flux de données et des fonctions de recherche sémantique. Selon Clément Stenac, l’entreprise avait déjà mis à disposition de ses clients des assistants de programmation, de génération SQL et de conception de recettes de préparation de données.

L’éditeur n’oublie pas ses fondamentaux. Il lancera en octobre de nouvelles fonctionnalités de modélisation linéaire généralisée visuelles, très usitées par les assurances. Un outil de visualisation graphe est également prévu au même moment.

Pour les acteurs de l’industrie, Dataiku développe Parameter Analyzer. Cette application dédiée aux ingénieurs processus de l’industrie manufacturière doit leur permettre de vérifier « l’adéquation entre les paramètres de production, les résultats attendus et ceux obtenus ». Parameter Analyzer s’appuie sur les pipelines de données mis à disposition par les ingénieurs de données.

« Ces process engineers ont une interface complètement dédiée qui leur permet de faire des expériences », assure Clément Stenac. « Ils sauvegardent leurs résultats, qui peuvent être utilisés dans la suite du pipeline par des data scientists pour créer des modèles de prévision et en faire des agents d’amélioration de production », ajoute-t-il.

D’autres « Business Apps » sont en préparation.

Une « couche de raisonnement » pour combiner IA et machine learning

À plus long terme, Florian Douetteau, cofondateur et directeur général de Dataiku, évoque la nécessaire mise en place d’une « couche de raisonnement » dans les entreprises. Ici, pas de « pensée magique ». Le dirigeant évoque le fait que les modèles de raisonnement ne peuvent pas réellement s’organiser seuls. Le fait de fournir de la documentation aux agents ne suffit pas, tandis qu’il n’est pas évident que des interfaces conversationnelles suffisent quand il faudra réparer les potentielles erreurs de ces systèmes d’IA complexes.

Cette couche inclurait des « blocs de raisonnement » – IA agentique, algorithmes prédictifs, analytiques, règles métier, boucles de feedback humaines en continu, etc. – régi par un ensemble d’outils d’orchestration, de supervision et de gouvernance. Ces blocs pourraient être combinés afin de répondre à des cas d’usage spécifiques. Il s’agit de pouvoir « s’adapter à de nouvelles conditions externes ». De traduire un processus métier qui ne serait pas encore documenté avant de l’automatiser.

« Dans les trois ans à venir, tel que je l’imagine, les entreprises vont effectivement commencer à vouloir automatiser de bout en bout leurs problèmes et leurs processus les plus critiques », déclare Florian Douetteau. « Pour moi, il y a une inévitabilité à devoir créer cette couche de raisonnement au-dessus du stockage et du calcul. Elle va leur permettre d’être efficaces quand ils vont créer ce nouveau type de système d’intelligence artificielle. C’est le focus de nos développements à venir ».

Pour approfondir sur IA appliquée, GenAI, IA infusée