CustomerLake : Databricks présente sa CDP « agentique »
Avec CustomerLake, Databricks entend prendre en charge les fonctionnalités principales d’une CDP. Il y ajoute deux boucles agentiques pour l’automatisation des campagnes marketing et la résolution des identités clients. Malgré le chevauchement évident avec les outils de Salesforce et d’Adobe, Ali Ghodsi, cofondateur et CEO de Databricks, assure qu’il ne cherche pas à détrôner ces acteurs. Les analystes, eux, voient là le début d’un grand chambardement dans la MarTech.
Lors de sa conférence annuelle, le spécialiste de la gestion de données n’a pas seulement évoqué les évolutions de sa plateforme. Il a aussi affiché son intention de s’installer sur un marché actuellement dominé par Adobe et Salesforce : celui de la Customer Data Platform (CDP).
« Que font les CDP ? Premièrement, elles peuvent transformer les données brutes en vues à 360 degrés des clients, organiser les données et les préparer pour un usage métier », explique Tasso Argyros, vice-président ingénierie chez Databricks, lors d’un keynote de Data+AI Summit 2026. « Ensuite, elles disposent d’une interface utilisateur métier où les marketeurs peuvent venir créer des audiences et des parcours », poursuit-il. « Et enfin, elles envoient des données aux outils marketing qui diffusent du contenu au client final, comme les outils d’emailing ou les plateformes publicitaires ». Ce processus s’appelle le reverse ETL. Habituellement, les données affluent de la CDP vers le contenu ou la plateforme publicitaire.
CustomerLake, une CDP « embarquée » dans un lakehouse
Une fois que les campagnes sont terminées, les données sont généralement stockées dans un lakehouse. Snowflake et Databricks sont des cibles privilégiées. Il s’agit ensuite d’approfondir les analyses pour améliorer les campagnes, engranger davantage d’audience, déterminer le meilleur moment pour « activer » des clients finaux, etc.
Or, les entreprises utilisent plusieurs briques d’activation, souvent difficiles à joindre avec la CDP, défend Databricks.
L’éditeur propose l’unification de l’architecture des données marketing. Il invite les clients à faire de sa plateforme de gestion de données unifiées le socle d’une CDP embarquée. Sa solution CustomerLake doit porter des fonctionnalités comme la connaissance clients à 360 degrés, la résolution d’identités, la segmentation (« audience building »), l’automatisation des campagnes, l’activation des clients et la personnalisation des messages.
Cette CDP nommée CustomerLake, en préversion privée, réside « au même endroit où sont gérés les données des entreprises et les modèles d’IA ». Databricks développe par ailleurs son propre système de Reverse ETL. Salesforce, Fivetran, et Matillion sont quelques-uns des acteurs qui maintiennent ce type de pipelines bidirectionnels.
Évidemment, cette CDP doit être « agentique ». D’où l’intérêt de la rapprocher de la couche de gouvernance, selon Tasso Argyros. « Les agents IA doivent être au plus proche des données et des LLM », argue-t-il.
Deux boucles agentiques dédiées au marketing
Au-delà d’un socle de gestion de données, Databricks a présenté le concept de « campagne marketing infinie ». « Les agents IA sont au cœur de ce nouveau type de flux de travail », affirme le vice-président. « Ces boucles agentiques permettent de mettre en place des campagnes pérennes, en temps réel et s’adaptant en permanence, qui personnalisent l’expérience de chaque client grâce à des agents IA dédiés ».
Ce sont les rôles des « Campaign Agents, l’un des deux premiers modules agentiques disponibles en préversion privée. Databricks a également présenté les “Profile Agents”, le second module déjà accessible.
« Les agents de profilage sont des agents qui automatisent le processus de création de données client à 360°, prêtes à être exploitées », décrit Tasso Argyros. « Ils se mettent à la tâche à partir d’une consigne définissant un cas d’usage. Ils ingèrent, transforment et enrichissent les données. Ils identifient les clients et évaluent les profils afin de générer cette boucle d’agents qui améliore sans cesse la qualité ».
« Nous sommes en mesure de baliser systématiquement les données ainsi que d’en améliorer la qualité, par exemple en corrigeant les e-mails, les adresses et les numéros de téléphone », ajoute le vice-président ingénierie chez Databricks.
« Historiquement, cela s’est fait soit par le biais de règles SQL statiques, soit par l’apprentissage automatique », poursuit-il. « Ces deux approches présentent des limites importantes, et nous estimons que la résolution d’identité par agent l’emporte sur tous les plans face à ces approches traditionnelles ».
Mais avant d’exploiter ces boucles agentiques, il faut ingérer les données au sein de la CDP. Pour ce faire, Databricks mise sur les données déjà disponibles dans le lakehouse, le service d’ingestion LakeFlow Connect, sa place de marché de données et des partenaires.
Adobe, Meta, Braze, Acxiom, Epsilon, theTradeDesk, /LiveRamp (bientôt aux mains de Publicis), Iterable, Bloomreach, Snapchat, Magnite, Transunion, adstra, Twilio, IAS, Unity, Accenture Song, Deloitte, Livelytics, Slalom et Stitch sont les partenaires de lancement de CustomerLake. Parmi les premiers clients à tester sa CDP, l’éditeur cite HP, ABInBev, General Motors, GetNet by Santander, Virgin Atlantic et Adidas.
Malgré les dires de son CEO, Databricks secoue le marché de la CDP, soulignent les analystes
« Cette initiative constitue un défi direct lancé aux CDP traditionnels et marque le début d’une nouvelle ère où ce sont les agents d’IA, et non plus seulement les tableaux de bord ou les pipelines de données, qui déterminent les résultats marketing », affirme Keith Kirkpatrick, vice-président et directeur de recherche chez Futurum Group. « L’enjeu : savoir qui contrôle la couche d’activation au sein de l’architecture d’entreprise basée sur l’IA ».
L’analyste considère que Databricks s’invite sur un marché habituellement occupé par Salesforce, Adobe, Twilio et Segment.
Là où Databricks a véritablement sa chance, c’est en ciblant Data360, le « data cloud » de Salesforce.
« Data Cloud continue de fonctionner comme un complément au CRM plutôt que d’être intégré de manière native dans un lac de données gouverné, tandis que CustomerLake remet directement en cause cette approche en éliminant la couche de duplication des données », avance Keith Kirkpatrick. « Alors que 41 % des décideurs cherchent à consolider leurs données et citent la “réduction des coûts informatiques” comme principal moteur (19 % la classent en première position), Salesforce risque de perdre la couche d’orchestration des données ».
« Nous ne devenons pas un concurrent à part entière de Salesforce », répond indirectement Ali Ghodsi, cofondateur et CEO de Databricks. « C’est l’un de nos partenaires ».
Et de rappeler que Databricks veut automatiser des activations et les campagnes. En cela, « Salesforce Marketing Cloud joue donc un rôle essentiel », assure-t-il.
« C’est grâce à cette solution que l’on peut déployer des campagnes par e-mail et d’autres initiatives. […] De plus, nous avons mis en place un partage de données entre Data 360 et notre plateforme, ce qui est important pour nous », renchérit-il. « De manière générale, je dirais simplement que le domaine du marketing va complètement changer. Il va devenir entièrement automatisé et beaucoup plus intégré ».
« Cela marque le début d’une course au développement de plateformes qui va redéfinir la gestion des données clients et les opérations marketing », confirme Gartner.
Malgré tout, il est peu probable que Databricks remplace Salesforce du jour au lendemain, d’après l’analyste de Futurum Group. Les habitudes des entreprises et l’enfermement propriétaire ont la vie dure. Twilio et Segment sont davantage menacés puisqu’ils proposent des couches de traitement que Databricks peut embarquer. Adobe a lui aussi lancé une suite agentique à travers CX Enterprise, rappelle Keith Kirkpatrick. Toutefois, Marketo ne bénéficierait pas du même traitement et pourrait être « relégué au second plan », anticipe-t-il.
Des clients prudents, mais curieux
En clair, il n’est pas évident que les entreprises adoptent les outils agentiques de Databricks. C’est sans doute le pari fait par Adobe. En revanche, le back-end proposé par l’éditeur est attrayant. C’est le socle de nombreux traitements chez l’expert de la CX et des outils de création. Tous usages confondus, Adobe gère 21 pétaoctets depuis les instances de Databricks.
Les clients européens de Databricks croisées lors d’un point presse sont pour l’heure curieux concernant CustomerLake, même s’ils ne sont pas prêts à l’adopter.
Par exemple, Amadeus n’a pas vocation à utiliser directement CustomerLake, l’un de ses représentants voit la solution comme un moyen de propager davantage les données et les rapports analytiques concernant les expériences des voyageurs. « Nous nous demandons comment intégrer nos données dans cet écosystème [celui de Databricks, N.D.L.R] pour que les clients y aient un meilleur accès », affirme Michael Yeomans, SVP Travel Intelligence chez Amadeus.
« Je pense que Genie [l’assistant agentique de Databricks, N.D.L.R] aidera ensuite à développer des cas d’usage, alors qu’habituellement nos données sont confiées à une petite équipe d’analystes afin de combiner les données et celles de nos clients ».
« Nous avons déjà une CDP », affirme pour sa part Jelle van Etten, Head of Global Data Platform chez Heineken, client de Databricks depuis 2020. « Tout n’est pas idéal non plus. Donc nous allons explorer [la solution] afin de voir si nous avons intérêt à l’intégrer au reste de notre plateforme ».
« C’est un moment intéressant pour nous et pour le marché », conclut Samuel Bonamigo, SVP et directeur général EMEA chez Databricks.
Ce n’est pas la première fois que Databricks s’attaque à un marché a priori éloigné du sien. Il tente aussi sa chance dans le domaine de la cybersécurité. Les dirigeants ont évoqué les évolutions de LakeWatch, le SIEM de l’éditeur présenté en mars 2026. Il a par ailleurs annoncé l’acquisition de Panther, un SOC propulsé à l’IA et permettant de rédiger des règles de détection en Python.
Pour approfondir sur Gestion de la relation client (CRM)
-
MDM et IA agentique : Informatica consolide ses ponts avec Salesforce
-
IA agentique : Tableau repositionne (encore) sa plateforme analytique
-
Salesforce et Informatica tracent les grandes lignes de leur feuille de route commune
-
IA agentique : Microsoft étoffe sa modélisation sémantique et ses outils de recherche
