alphaspirit - stock.adobe.com

Context Graph : le nouveau Graal de l'IA agentique à la loupe

Parce qu’ils doivent capturer non seulement les données, mais surtout le raisonnement qui se cache derrière chaque décision, les graphes de contexte sont présentés comme le chaînon manquant de la mémoire des agents IA. Un concept qui suscite beaucoup d'enthousiasme chez les éditeurs et… un scepticisme croissant chez les experts qui y voient du « vieux vin dans de nouvelles outres ».

Un concept s’impose dans le petit monde de l’IA générative et agentique : la mémoire. La mémoire contient les informations nécessaires à la génération d’un contenu plus fiable par un assistant et à la prise d’action par un agent IA. Mais il existe plusieurs types de mémoire.

Les éditeurs et les fournisseurs ont décliné des fonctionnalités en ce sens. Par exemple, AWS a introduit en décembre dernier la mémoire à long terme au sein de son framework AgentCore. Elle vise à suivre les interactions avec les agents au fil du temps. Elle se superpose à une mémoire épisodique, spécifique au déroulement des interactions, en sus d’une mémoire à court terme, celle contenue dans la fenêtre de contexte du grand modèle de langage qui propulse l’agent IA.

Dans la « couche d’intelligence » Work IQ de Microsoft, une mémoire explicite renferme les instructions personnalisées, tandis que la mémoire implicite contient l’historique des conversations avec les agents IA et bientôt les activités dans les différents outils de Microsoft 365, Dynamics 365, Power Apps et Power BI. À cela s’ajoute une couche combinant sémantique, ontologique et graphe. Elle doit capturer la « connaissance procédurale » au sein d’une entreprise.

Un problème de mémoire

L’IA agentique fait donc émerger une troisième couche mémorielle. Ces deux dernières années, les éditeurs ont davantage évoqué deux types de mémoire. Une mémoire à court terme, qui contient les derniers échanges avec le LLM, et une mémoire à long terme, d’abord sous la forme d’une base documentaire propulsée par un système RAG, puis, pour les plus avancés, complétés par un graphe de connaissances. C’est le sens des premiers développements chez ServiceNow, annoncés en 2024.

Si cette approche était suffisante pour un chatbot, elle ne l’est plus pour un véritable agent IA. C’est en tout cas ce que considèrent la plupart des fournisseurs. Comme Microsoft, Neo4j, estime qu’il manque une corde à l’arc des graphes de connaissances.

« Les graphes de connaissances, pour simplifier, capturent le « quoi » d’un problème, c’est-à-dire les entités clés, leurs relations entre elles, en somme, l’état du monde tel qu’il est représenté à travers ces liens », explique Jésus Barrasa, Field CTO chez Neo4j, auprès du MagIT. « Ce que les graphes de connaissances n’incluent pas par défaut, c’est le raisonnement, le « pourquoi » des choses », poursuit le coauteur du livre « Building Knowledge Graphs : à practitioner’s guide ».

« Imaginons qu’un client ait acheté un produit particulier à un prix inhabituellement bas, grâce à une remise. Il n'y a probablement pas d'informations sur le processus d'approbation de cette remise particulière ».

De fait, ce type de processus n’est pas souvent documenté, puisque profondément basé sur les échanges humains. Quand il l’est, la trace de la décision est enfermée dans un mail, une conversation sur un outil de collaboration, ou encore dans un échange téléphonique (si sa transcription existe).

Étendre le graphe de connaissances au contexte qui entoure chaque décision

« La collecte de ces données est une tâche délicate. Ce qui change radicalement c’est que nous avons désormais des agents qui nous assistent, qui enrichissent le processus et qui participent à l’orchestration de ces décisions. Et les agents excellent dans la saisie de tous ces détails », affirme Jésus Barrasa. « Nous disposons là d’un moyen réalisable et viable de saisir toutes ces informations ».

Ces informations doivent nourrir le graphe de connaissances, en sus des traces de raisonnement générées et des appels d’outils effectués par les agents IA. « Nous avions déjà commencé à explorer et à formaliser la mémoire procédurale, qui correspond à la trace de l'exécution d'un agent pour accomplir une tâche particulière », évoque le Field CTO chez Neo4j.

Pour les spécialistes des graphes, les trois couches de mémoire – à court terme, à long terme et la mémoire procédurale (ou de raisonnement) – étendent le graphe de connaissances et le font évoluer en « Context Graph ».

Qu’est-ce que le Context Graph ?

Le concept est attribuable à Jaya Gupta et Ashu Garg, respectivement partenaire et partenaire général chez le fonds d’investissement Foundation Capital.

Eux-mêmes inspirés par un billet de Jamin Ball (« Long Live Systems of Records », longue vie aux systèmes d’enregistrement, en Français), partenaires chez Altimeter Capital, ils ont rédigé l’article « AI’s trillion-dollar opportunity: Context graphs » (« L'opportunité à un millier de milliards de dollars pour l'IA : les graphes de contexte »). Il a été publié le 22 décembre dernier.

« Les agents n'ont pas seulement besoin de règles », écrivent-ils. « Ils doivent pouvoir accéder aux historiques de décision qui montrent comment les règles ont été appliquées par le passé, où des dérogations ont été accordées, comment les conflits ont été résolus, qui a approuvé quoi, et quels précédents régissent réellement la situation ».

« Nous appelons « graphe de contexte » la structure globale formée par ces traces », poursuivent-ils plus loin. « Il ne s'agit pas de « la chaîne de raisonnement du modèle », mais d'un historique dynamique des traces décisionnelles reliant les entités et les moments dans le temps, de sorte que les précédents deviennent consultables ».

Un manifeste qui a attiré l’attention des dirigeants de HubSpot et de Glean, entre autres.

« Je pense que cela a attiré l'attention de beaucoup de monde. Pas seulement du côté technologique, mais aussi les directions », affirme Jésus Barrasa. « Et il y a une chose que je trouve incroyable, c'est le consensus pratiquement unanime autour du fait qu'il doit s’agir d’un graphe », ajoute-t-il. « C’est ce sur quoi nous travaillons depuis tant d’années. Cela nous place dans une position idéale pour aider nos clients à relever ce défi ».

Du neuf avec du vieux (et quelques confusions)

Attention. Il ne faudrait pas confondre le contexte désigné ici –, les circonstances et les conditions qui englobent un fait ou une décision – du contexte des grands modèles de langage et de l’ingénierie de contexte.  Le contexte du LLM n’est autre que la capacité finie de tokens qu’il peut gérer.

Et, selon Anthropic, « l’ingénierie de contexte désigne l'ensemble des stratégies visant à sélectionner et à conserver l'ensemble optimal de tokens (informations) pendant l'inférence d'un LLM, y compris toutes les autres informations susceptibles d'y être intégrées en dehors des prompts ».

C’est ce qui trouble Esteban Kolski, membre du comité de direction du cabinet d’analyste Constellation Research. Selon lui, « les graphes de contexte constituent une aberration marketing ».

L’appellation créerait une confusion entre le contexte – « la capacité des ordinateurs à cerner le lieu, le moment et le besoin appropriés en s'appuyant sur des informations complémentaires au contenu » -et les graphes, censée faciliter « la compréhension du contexte en visualisant les relations entre les éléments et la situation ».

« Même si cette approche simpliste permet de concilier ces concepts, elle prive le contexte de sa véritable valeur, qui consiste à aller au-delà des graphes », poursuit-il. « Se concentrer sur les graphes comme seul moyen de représenter le contexte est schématique et, surtout, crée un « segment de marché » où les éditeurs et les investisseurs peuvent mettre en avant leurs atouts ».

De son côté, Hicham Zmarrou, lead architect Data & IA chez Microsoft, considère le concept de graphe de contexte comme « du vieux vin dans de nouvelles outres ». « Les graphes de contexte sont une formalisation et une intégration de pratiques de modélisation qui existent depuis des décennies », écrit-il dans un billet sur LinkedIn. Un avis partagé par Tony Seale, ancien architecte Knowledge Graph chez UBS, devenu consultant à son compte. Comme quoi les voix critiques ou plus nuancées ne manquent pas.

Les entreprises ont déjà modélisé des domaines, documenté une partie des processus, ont stocké des logs d’événement et ont accès aux diagrammes d’intégration. Toutefois, l’IA agentique réclame une plus forte orchestration de ces briques isolées. Leur mise en musique à travers des graphes de connaissances, des couches sémantiques ou des graphes de contexte doit permettre de s’assurer du bon fonctionnement et de la conformité des agents IA, estime Hicham Zmarrou.

Quand Microsoft infuse ce principe dans les environnements associés à Copilot, Neo4j le décline dans un projet open source expérimental – nommé agent memory. Il met en musique les préceptes décrits par Foundation Capital.

« Ce package open source s'intègre très facilement avec les frameworks standards, dont LangChain, LlamaIndex, et ainsi de suite, et vous donnent un moyen facile de commencer à construire ce graphe de contexte », avance Jésus Barrasa. Neo4j prévient : ce projet open source n’est pas officiellement supportée. Aucun SLA et accord commercial n’y sont associés.

L’éditeur est pour l’instant en discussion avec des clients depuis janvier 2026. Un petit nombre de clients expérimentent la mémoire procédurale, mais aucun d’entre eux n’a adopté à proprement parler de graphes de contexte. D’autres acteurs comme Mem0, Cognee et Zep s’appuient sur la base de données orientée graphes de Neo4j (ou Memgraph, Neptune, etc.) pour en faire un produit/middleware. Selon l’intérêt suscité par ce concept et par les projets qui en découle, Jésus Barrasa n’écarte pas l’idée que Neo4j intègre cette capacité dans son offre managée.

Une approche plus compatible avec une refonte en profondeur des systèmes

Le Field CTO le reconnaît toutefois, il sera difficile, dans un premier temps, d’appliquer les graphes de contexte dans un environnement brownfield.

« Construire un graphe de contexte rétrospectivement va être difficile parce qu'aller collecter des traces de décision partout où elle se trouve (les mails, Slack, l’ERP, le CRM, etc.) et y appliquer les niveaux de contrôle approprié n’est toujours pas simple », affirme-t-il. « En revanche, intégrer les graphes de contexte dès le départ dans de nouveaux agents IA me paraît une évidence et représente la meilleure stratégie ».

C’est pourtant la (relative) simplicité d’intégration dans l’existant en prenant en compte son caractère protéiforme qui déterminera si les entreprises adoptent elles-mêmes cette approche. D’autant que les entités ayant généralisé l’usage des bases de données orientées graphes au-delà de quelques domaines spécifiques sont peu nombreuses.

« L'échelle est finalement déterminée par la quantité de données que vous souhaitez stocker dans votre graphe. Comme pour toute autre chose, vous pouvez y mettre des limites », nuance Jésus Barrasa. Le paysage contextuel serait alors partiel.

Ces limites devront aussi déterminer la manière dont les données sont remplacées ou supprimées lorsqu'un processus ou qu’une information clé change. Aux entreprises de les fixer. Tout comme elles détermineront si une base de données orientée graphes est la bonne technologie pour capturer ce contexte décisionnel.

« Ai-je besoin d'une base de données ou puis-je stocker ces données dans un système de fichiers ? Cela dépend de l'ampleur du projet. Cela dépend des performances attendues. Cela dépend de la complexité. Je suis donc tout à fait favorable à l'idée de ne pas vouloir tout faire d'un coup ni de compliquer inutilement un problème », affirme Jésus Barrasa. « Et c'est à chaque organisation d'en décider. Mais notre thèse est qu'une plateforme solide [comme la nôtre] vous simplifiera la vie », insiste-t-il.

Pour approfondir sur IA appliquée, GenAI, IA infusée