« Databricks n’est plus compliqué » (David Meyer, Databricks)

Devant ses clients français, Databricks a mis en avant ses efforts pour simplifier l’usage de sa plateforme. La réalité est plus nuancée que ce message, reconnaissent les porte-parole de l’éditeur.

Le mardi 2 décembre, Databricks organisait à Paris la Défense Arena son Data & AI World Tour français. Environ 2 200 personnes ont fait le déplacement. Parmi elles, des employés de La Poste, Axa, Société Générale, Engie, ou encore TotalÉnergies venu en délégation. L’éditeur californien revendique avoir convaincu « 90 % » des entreprises du CAC40, mais ne communique plus sur le nombre exact de clients français, comme il a pu faire par le passé. Databricks a élargi son portefeuille de grands comptes.

En avril dernier, Danone s’est engagé auprès du fournisseur dans l’objectif d’améliorer la qualité des données et « réduire de 30 % le temps nécessaire entre la collecte de données et la prise de décisions ».

« Nous voyons chez les clients existants une démocratisation de l’usage », affirme Samuel Bonamigo, vice-président senior et directeur général EMEA chez Databricks, lors d’un point presse. « Nous avons eu 40 témoignages clients [lors du Data & AI World Tour Paris]. Par exemple, 200 personnes de La Poste ont fait le déplacement ».

Se départir d’une image qui lui colle à la peau

Cette notion de démocratisation est importante pour l’éditeur. Il tente de la distiller depuis 2020. Mais une réputation lui colle à la peau. Celle de fournir une plateforme complexe, réservée aux ingénieurs de données. Et un événement comme Data&AI World est également mis sur pied pour convaincre de nouveaux clients.

« Databricks n’est plus compliqué [Databricks isn’t complex anymore, en VO]. Notre plateforme peut être utilisée par tous les métiers de vos entreprises », avance David Meyer, vice-président senior responsable du produit chez Databricks, sur scène.

Il faut dire que Databricks a misé et mise encore sur l’aura de ses sept cofondateurs. Des docteurs qui se sont rencontrés sur les bancs de l’université de Berkeley en 2009. L’année où Matei Zaharia, cofondateur et directeur technique de Databricks, a conçu et développé la première itération du moteur de traitements de données massives Apache Spark. Databricks a été fondé quatre ans plus tard, en 2013. 

« Pendant très longtemps, vous nous avez vus comme un fournisseur d’une distribution de Spark pour les entreprises, parce que nous étions en train de construire les fondations, et cela a pris du temps », affirme Nicolas Maillard, vice-président Field Engineering de la région SEMEA chez Databricks. « Notre point de vue, c’était de dire qu’il faut repartir des fondamentaux et de reconstruire vers l’applicatif ».

Vers les applications et les usages de l’IA. Devant les clients français, Databricks a surtout mis en scène la relation entre sa couche de gouvernance unifiée, Unity Catalog, avec ses Apps et son service AI/BI. Le service qui mêle intelligence artificielle et visualisation de données aurait bénéficié d’une croissance de 500 % des usages entre juin 2024 et juin 2025.

L’éditeur place désormais Agent Bricks, sa suite de conception et de tests d’agents IA, au centre de son dispositif.

« L’on entend souvent : “pas de données, pas d’IA”. Je pense que cela demande une précision : je dirais plutôt : “pas de données gouvernées, pas d’IA” ».
Samuel BonamigoVice-président senior et directeur général EMEA, Databricks

« L’on entend souvent : “pas de données, pas d’IA”. Je pense que cela demande une précision : je dirais plutôt : “pas de données gouvernées, pas d’IA” », avance Samuel Bonamigo.

Unity Catalog « ne sert pas seulement à gouverner des tables, des lignes, des colonnes, des documents », selon David Meyer, mais aussi des modèles de machine learning, des réseaux de neurones et des agents IA.

L’adoption de l’IA agentique chez les clients européens de Databricks est toutefois « early stage », observe Samuel Bonamigo. « Nous sommes au tout début de ce sujet », avance-t-il.

C’est l’une des trois tendances listées par Yannis Daubin, vice-président SEIMEA chez Databricks. « Les métiers dans les entreprises, les comités exécutifs, achètent tous l’efficacité, la productivité, la baisse des coûts promises par l’IA, la GenAI et les agents. Il y a ensuite la gouvernance, et plus largement la sécurité et la confiance dans les données. Il s’agit de reprendre la main sur les données existantes. Enfin, les clients font le vœu d’homogénéiser leur architecture de données », résume-t-il.

Databricks se dit prêt à y répondre.

Une plateforme unifiée, mais « pas de big bang »

« Nous avons une stratégie différenciante par rapport au marché », poursuit Samuel Bonamigo. « La plateforme est complète, open source du sol au plafond, interopérable et nous offrons une plateforme multicloud. Cela reflète un alignement avec le choix de nos clients français qui ont tous sélectionné plusieurs clouds ». Son concurrent Snowflake affiche une approche plus propriétaire à certains égards, mais s’est assuré de prendre en charge le format de tables ouvert Apache Iceberg.

L’heure est à l’unification de la gestion de données, dispersée de longue date à travers différentes infrastructures.

« Notre activité première consiste à bâtir les fondations nécessaires pour supporter les cas d’usage métiers. Dans un même temps, tous nos clients ont des patrimoines technologiques différents », constate Yannis Daubin. « Il s’agit de leur proposer une plateforme qui leur permet d’avancer à leur rythme », insiste-t-il. « En matière de création d’une fondation de données unifiée, il n’y a pas de big bang. Et avec Databricks, vous pouvez lancer des projets en misant sur la fédération de données, en continuant à exploiter le patrimoine existant. Cette migration vers une plateforme unique se fera dans le temps ».

« En matière de création d’une fondation de données unifiée, il n’y a pas de big bang. Et avec Databricks, vous pouvez lancer des projets en misant sur la fédération de données ».
Yannis DaubinVice-président SEIMEA, Databricks

À ce titre, au-delà d’Apache Spark, l’éditeur a prouvé l’intérêt pour son approche lakehouse. En tout cas, il a su rendre possible la vision portée par la combinaison d’Apache Hive et d’Hadoop. Son offre Databricks SQL lui permet d’engranger 1 milliard sur les 4 milliards de dollars de son chiffre d’affaires projeté d’ici à la fin de l’année.

Open source, facilité d’usage : Gartner minimise les saillies marketing de Databricks

Néanmoins, dans son Magic Quadrant 2025 consacré au système de gestion de données cloud publié le 18 novembre, Gartner rapporte que ses clients lui « signalent systématiquement que l’utilisation efficace de Databricks nécessite un niveau élevé de compétences techniques ». L’offre Databricks One, une interface permettant d’accéder aux applications, aux assistants IA et à la suite AI/BI a été lancée en juin. Selon le Gartner, l’éditeur vient donc « de commencer à s’attaquer à ce problème ».

Lors de l’événement parisien, il a présenté la préversion publique d’espaces de travail serverless. C’est un moyen d’accélérer le provisionnement de capacité de calcul dédié à l’exécution de flux de travail analytiques et de visualisation éphémères « qui utilisent AI/BI, l’assistant Genie, Databricks Apps, les warehouses SQL ou des notebooks ».

Concernant le machine learning et l’IA, le cabinet mentionne également une courbe d’apprentissage abrupt. Databricks conserve néanmoins l’avantage du précurseur où la compétition s’arme. D’où l’émergence d’une version gratuite et d’un investissement de 100 millions de dollars dans la formation et le secteur de l’éducation. Il coopère avec 1 200 universités et établissements.

Malgré le fait que Databricks se dit moins cher que ses adversaires et qu’il fournit des outils de gestion financière, « de nombreux clients signalent des difficultés à comprendre et à gérer les coûts de Databricks ».

Au-delà d’un passage à un modèle entièrement OPEX, nouveau pour certains d’entre eux, « la liste étendue de produits et les nouvelles fonctionnalités de Databricks contribuent à la difficulté ».

Quant à l’argument open source, il ne tient pas dans certains cas. Gartner rapporte des inquiétudes concernant un éventuel verrouillage propriétaire de certaines fonctions propriétaires incompatibles avec d’autres outils, l’orchestration et Delta Live Tables en tête. « Les clients doivent déterminer s’ils doivent créer leurs propres couches d’abstraction pour atténuer le risque de verrouillage », notent les analystes. 

Enfin, Unity Catalog, dont la version open source a fêté sa première année en juin dernier, est utilisé « plus de 700 entreprises pour gouverner de manière centrale des moteurs analytiques et des outils », dixit Databricks. À titre de comparaison, l’éditeur revendique 20 000 clients dans le monde. Comme son concurrent Apache Polaris, la possibilité d’utiliser d’autres moteurs (Trino, DuckDB, Spark tiers) pour écrire dans les tables gérées par la plateforme est en préversion privée.

Databricks investit fortement dans la région EMEA

Treize des 30 bureaux sont situés dans la région Europe, Moyen-Orient et Afrique. Environ 2 000 des 8 000 employés y sont rattachés. Il a installé ou conservé des équipes produit et R&D à Amsterdam, Berlin et Belgrade.

Et le fournisseur de revendiquer 300 000 utilisateurs actifs en Europe, dont 30 000 ont bénéficié d’une formation. Près de 200 employés sont rattachés au bureau parisien du spécialiste du lakehouse. Il aurait réussi à réunir plus de 5 800 partenaires.

 

Pour approfondir sur Datawarehouse