Getty Images/iStockphoto

Confluent pose les briques de son système multiagent orienté événements

Confluent entend faire du combo Kafka-Flink un moteur de contextualisation en temps réel de systèmes multiagents. Les premières briques sont posées, mais il faut encore connecter les points.

Confluent a profité de sa conférence Current à la nouvelle Orléans pour présenter la mise à jour du quatrième trimestre 2025 pour sa plateforme Confluent Cloud. Lors de son événement londonien en mai, le contributeur principal d’Apache Kafka ne faisait pas de mystère sur sa volonté de mêler « event-driven », temps réel et IA agentique.

En août dernier, l’éditeur a présenté Streaming Agents, un moyen de « créer, déployer et orchestrer des agents IA orientés événements » sur Confluent Cloud for Apache Flink. Cette capacité, qui entre dans sa phase 2 de préversion publique, s’inscrit dans l’initiative « Confluent Intelligence ».

L’idée est de rendre activables les flux de données en temps réel par les agents IA. Jusqu’alors, les architectures mises en place réclament l’indexation de données avant leur exploitation par des modèles de langage. Or, celle-ci n’est pas adaptée aux cas d’usage en quasi-temps réel, dans lesquels des informations peuvent changer de manière dynamique. C’est le cas des conditions météorologiques, des listes de départ et d’arrivée de transports en commun (avion, bus, train), de l’état d’un inventaire dans un entrepôt, etc.

« Ou alors, vous pouvez vouloir réagir à un événement pour activer certaines étapes dans un processus métier », expliquait en juin Andrew Sellers, vice-président de la stratégie technologique chez Confluent. Et de donner l’exemple du traitement des réclamations d’assurance qui peuvent exiger de préparer des données non structurées pour leur traitement par les modèles de risques dont les résultats sont envoyés par les responsables.

Définir et rejouer les flux de travail agentiques

À ce titre, Streaming Agents est complété par des fonctions SQL Flink (UDF) pour invoquer des modèles de langage, des modèles d’embeddings, des appels de fonction et des outils via le protocole Model Context Protocol (MCP).

Mais la mise à jour Q4 de Confluent Cloud ajoute de nouveaux « primitifs ». Il y a d’abord Agent Definition. Cette fonction en préversion publique permet de spécifier de manière déclarative (à l’aide d’une syntaxe SQL), le modèle de raisonnement de référence, le prompt système, les outils que les agents peuvent utiliser et des options de configuration. Ces définitions sont enregistrées dans le catalogue Flink.

Ce moyen de définir des agents IA est accompagné de fonctions d’observabilité et de débogage. Il s’agit de collecter les événements des agents, l’invocation des outils, les résultats des LLM, etc., afin d’auditer les systèmes agentiques en cas de problème et de comprendre les potentiels éléments qui peuvent être améliorés. Ce n’est pas une fonction anodine, selon Andrew Sellers.

« Jusqu’il y a peu, les agents IA étaient des microservices stateful qui utilisaient des LLM », a-t-il lancé auprès du MagIT. « Ce n’est que lorsque l’on a introduit la notion d’event-driven qu’ils sont véritablement devenus pertinents. Cette architecture permet la rejouabilité, le traçage et le découplage des services. Je pense que nous sommes en train de voir la même chose avec les agents IA ». Et d’ajouter que les protocoles comme MCP et A2A découlent de cette même philosophie.

Alimenter les agents IA en données « fraîches »

En ce sens, le troisième élément de cette mise à jour est sans doute le plus important. Confluent introduit en « early access » ce qu’il appelle un moteur de contextualisation en temps réel. Celui-ci sert à servir des données structurées actualisées aux agents IA. C’est une « couche de services entièrement managée qui construit, met à jour et fournit en permanence le contexte via MCP », indique la documentation de l’éditeur.

Les données sont disponibles sous forme de vues matérialisées en lecture seule, stockées en mémoire. Il s’agit de les rendre interrogeables « instantanément ». Dans un même temps, les données sont tracées, gouvernées, auditables et cohérentes. « Lorsque les définitions ou les schémas en amont changent, le moteur retraite automatiquement les données impactées pour éviter les dérives, garantissant ainsi la cohérence des systèmes d’IA en aval sans intervention manuelle ni reconstruction », précise la documentation.

Sous le capot, ce moteur n’est autre qu’une combinaison de Kafka et de Flink. Ces deux technologies ne sont pas réputées pour être simples à exploiter. L’éditeur promet là d’abstraire ces difficultés.

Dans l’idée, le moteur doit alimenter en « données fraîches » des agents IA qui, eux-mêmes, produisent des résultats sous forme d’événements.

Tout de même, les LLM et les agents IA sont meilleurs pour traiter des données non structurées. Pour cela, Confluent laisse les entreprises s’appuyer sur les bases de données vectorielles du marché, dont Couchbase, Elasticsearch, MongoDB Atlas et Pinecone. La prise en charge d’autres technologies est sur la feuille de route, mais ce sont les quatre actuellement utilisables avec la fonction Vector Search de Confluent Cloud for Flink. Elle est également couplée avec une fonction de vectorisation « en temps réel ». Plus spécifiquement, une fonction UDF de Flink appelle un modèle d’embedding qui convertit les documents en vecteurs d’un topic Kafka source vers un topic cible.

Des blancs à combler

Confluent ne prétend pas vouloir imposer son framework de développement agentique. Il préfère se connecter aux outils du marché, dont AutoGen, CrewAI, LangGraph, Amazon Bedrock, Snowflake Cortex, Agentforce de Salesforce, SAP Joule ou encore Databricks.

« Nous voulons accélérer le temps de commercialisation des systèmes multiagents de nos clients et je pense que cela passe en grande partie par l’intégration avec tous les frameworks existants », confirmait déjà Andrew Sellers en juin dernier.

Or, la documentation technique ne décrit pas comment ces différents agents peuvent être orchestrés en connexion avec les différentes briques de l’initiative Confluent Intelligence. Les éléments techniques disponibles décrivent davantage des workflows agentiques, c’est-à-dire la manière dont les LLM, les outils et les bases de données sont orchestrés, étape par étape, afin d’accomplir des tâches spécifiques. Selon Sean Falconer, directeur senior de la stratégie IA chez Confluent, les patterns sont en cours de validation avec les partenaires de l’éditeur.

 

Pour approfondir sur IA appliquée, GenAI, IA infusée