Tijana - Fotolia

Pourquoi Databricks a-t-il levé 2,6 milliards de dollars en six mois

Le spécialiste du data management engrange 1,6 milliard de dollars en série H, ce qui porte son compteur de levée de fonds à 2,6 milliards cette année. Persuadée de son avantage technologique, l’entreprise a besoin de moyens conséquents pour tenter de dominer son marché.

Après le milliard de dollars récoltés en série G au mois de février 2021, à peine six mois plus tard Databricks officialise une levée de fonds de 1,6 milliard de dollars en série H.

Ce tour de table est mené par Counterpoint Global (filiale de Morgan Stanley). Quelques nouveaux VC dont BNY Mellon, Clearbridge et UC Investments, la branche investissement de l’université de Californie, font leur entrée dans la partie.

Mais ce sont surtout les investisseurs majeurs existants, Andreessen Horowitz, des fonds et des comptes gérés par BlackRock, [l’Office d’investissement du régime de pensions du Canada], Coatue Management, Fidelity Management & Research, Franklin Templeton, GIC, Greenoaks Capital, Octahedron Capital, des fonds et des comptes administrés par T. Rowe Price Associates, Tiger Global Management et Whale Rock qui ont remis la main au portefeuille.

Une liste d’investisseurs longue comme le bras

De manière plus anecdotique, Alta Park Capital, AWS, Arena Holdings, CapitalG (Google), Discovery Capital, Dragoneer Investment Group, Gaingels, Geodesic, Green Bay Ventures, Insight Partners, Microsoft et New Enterprise Associates ont également participé à cette collecte.

Au total, Databricks a récolté 3,5 milliards de dollars en huit tours de tables. Ce n’est plus une licorne, c’est tout un attelage.

Cette nouvelle série fait monter fortement la valorisation de Databricks de 28 milliards à 38 milliards de dollars entre février et août 2021. Comment une telle entreprise peut-elle grossir de 10 milliards de dollars en six mois ? Qu’est-ce qui justifie cet engouement ?

Des revenus annuels récurrents en hausse de 75 %

Databricks fait partie de ces acteurs avec Snowflake à impressionner par leur croissance. Et si le second n’arrive pas à se défaire de ses pertes (77,6 millions de dollars), son bilan financier public du deuxième trimestre fiscal 2022 montre qu’il a recruté 60 % de clients supplémentaires et engrangé 272,2 millions de dollars en lieu et place des 133,1 millions enregistrés à la même période l’année dernière. D’autres comme Dremio, Starbust, Dataiku ou encore Presto ont su persuader les investisseurs.

Conservant son statut d’entreprise privée, Databricks n’affiche pas publiquement l’état de ces créances, mais affirme avoir convaincu plus de 5 000 clients, dont 40 % des membres du Fortune 500 d’opter pour sa plateforme. Il y a peu d’indicateurs pour juger de son bon fonctionnement. Par exemple, Databricks ne souhaite pas révéler le volume de clients en Europe. « Nous ne faisons pas de ventilation par région », répond Ali Ghodsi, cofondateur et PDG de Databricks au MagIT.

Cependant, même si elle décale encore une fois la possibilité d’une introduction en bourse, l’entreprise a opté cette année pour un fonctionnement financier d’une société publique. Databricks lâche un premier chiffre qui a sans doute attiré la flopée d’investisseurs listés ci-dessus. L’éditeur générerait actuellement 600 millions de dollars de revenus annuels récurrents, contre 425 millions de RAR (ou ARR) à la fin de l’année fiscale 2021, soit une croissance de 75 % en un an. À titre de comparaison Snowflake revendique 4 990 clients au total, mais il n’affiche pas d’ARR à proprement parler, car le fournisseur facture à la consommation de ressources. Ce concurrent coté en bourse présente tous les trimestres un revenu produit (254,5 millions de dollars au deuxième trimestre fiscal 2022) et des « obligations de performance restantes » (Remaining Performance Obligation), c’est-à-dire « des revenus contractuels futurs qui n’ont pas encore été comptabilisés » (1,5 milliard de dollars recensés au Q2 2022).

Outre ces critères financiers et RH, la question de l’exécution se pose non seulement pour Databricks, mais aussi chez ses clients. En ce sens, l’un des objectifs de ce tour de table, de manière assez classique, est de recruter près de 700 collaborateurs avant la fin de l’année. Actuellement, Databricks compte 2 300 employés, dont « des centaines dans la région EMEA », rattachés à 20 bureaux répartis dans 19 pays du monde.

« Notre activité dans la région EMEA connaît une croissance d’environ 100 % et nous avons multiplié par quatre le nombre d’employés dans certains pays européens au cours des dernières années ».
Ali GhodsiCofondateur et PDG, Databricks

« Notre activité dans la région EMEA connaît une croissance d’environ 100 % et nous avons multiplié par quatre le nombre d’employés dans certains pays européens au cours des dernières années. Au niveau mondial, nous prévoyons d’avoir 3 000 employés d’ici la fin de l’année et nous sommes toujours à la recherche de talents », affirme Ali Ghodsi. « Nous planifions effectivement d’embaucher davantage de personnes dans la région EMEA. Notre centre de R&D d’Amsterdam accueille déjà plus de 20 % de nos ingénieurs ».

L’éditeur affirme avoir fait ses preuves en soutenant des cas d’usage d’envergure chez Electrolux et des projets importants chez Sega Europe – par exemple –, mais certains clients présentés sur le site Web de la firme expérimentent encore cette technologie. Si la plateforme semble avoir les capacités pour supporter de gros workloads de machine learning et de deep learning, la majorité des clients présentés sur son site Web évoquent principalement des ingestions de données, de traitement et d’analytique, puis des expérimentations ou des premiers déploiements ML.

Cela est peu surprenant. L’intérêt de l’éditeur pour les segments analytiques et BI démontre que les entreprises ne sont pas forcément prêtes à déployer des modèles IA à large échelle.

Rappelons que l’éditeur vend à qui veut l’entendre, son concept de Lakehouse, une architecture combinant data lake et data warehouse. Bien que les clients évoquent une accélération des cas d’usage et soulignent le soutien apporté par l’éditeur dans l’adoption de cette architecture, Ali Ghodsi en parle à la fois au présent et au futur. « Cette levée de fonds montre l’élan de notre plateforme Lakehouse et constitue une validation du marché, car il s’agit de l’architecture de données du futur », écrit-il au MagIT. Et d’enchaîner : « elle a déjà été adoptée par des entreprises comme McDonalds, JB Hunt et Shell ».

Objectif : « gagner la course au Lakehouse »

De leur côté, les analystes de Gartner évoquaient en mars dernier, à propos des plateformes de data science, un « marché adolescent », davantage porté sur l’innovation que sur « l’exécution pure ».

L’annonce de la nomination d’Andy Kofoid, en tant que directeur Global Field Operation, est une manière pour Databricks de répondre à cette critique, mais aussi de combler des capacités de livraison pour une entreprise qui affirme avoir créé sa propre catégorie. Le nouveau dirigeant vient de passer huit ans chez Salesforce, où il tenait dernièrement le poste de président de l’Amérique du Nord, « en charge d’une unité opérationnelle de plus de 12 milliards de dollars avec plus de 8 000 employés », selon la biographie fournie par Databricks. Il tenait auparavant le rôle de COO chez ExacTarget, une entreprise rachetée par Salesforce en 2013 pour 2,6 milliards de dollars.

« L’arrivée d’Andy Kofoid nous aidera à accélérer notre stratégie de mise sur le marché, ainsi que notre capacité à développer les ventes, le succès des clients et notre écosystème de partenaires. Andy a vu de près la création de catégories chez Salesforce, ce qui est important, car nous créons nous aussi une catégorie avec le Lakehouse », vante Ali Ghodsi.

Si Databricks est l’inventeur de ce concept plus ou moins marketing de Lakehouse, les grands de l’industrie, ces coopétiteurs que sont Microsoft et Google Cloud et d’autres ont repris ce principe à leur compte.

Voilà une autre raison qui explique ce court laps de temps entre deux collectes de fonds d’envergure. Databricks ne crachera pas sur les moyens qui lui permettront de rester dans la course qu’il a lui-même entamée.

« Selon nous, la stratégie consiste à gagner la course au Lakehouse. Nous sommes déjà en train de la remporter et ce tour de table va nous permettre d’étendre notre avance et de livrer nos clients encore plus rapidement », affirme sans broncher Ali Ghodsi.

Des défis technologiques d’envergure

Outre le fait de déployer la plateforme chez les clients, l’éditeur doit relever plusieurs défis technologiques, à commencer par la sécurisation de son produit. En ce sens, il vient de recruter Fermín J. Serna qui prend le rôle de Chief Security Officer (CSO) chez Databricks, passé au même poste chez Citrix et Semmle après sept ans en tant que responsable de la sécurité de divers produits chez Google.

« Fermín Serna dirigera nos programmes de sécurité à fort impact sur le réseau, la plateforme et les utilisateurs, ainsi que les efforts de gouvernance et de conformité », déclare le PDG de Databricks.

Aussi, la licorne veut convaincre les clients d’adopter son système de partage et de gouvernance de fichiers Delta Sharing, mais elle devra pour cela bâtir un écosystème puissant de partenaires.

Elle veut enrichir ses fonctionnalités d’analyse SQL et de machine learning et investir dans des capacités « multicloud et intercloud ». En effet, les déploiements de la plateforme de Databricks dépendent de la combinaison de briques spécifiques à chaque fournisseur de cloud, ce qui ne facilite pas forcément les échanges multicloud.

L’éditeur n’a pas réellement misé sur cette approche, jusqu’alors, arguant qu’une plateforme de data science unifiée était la clé de la réussite en ce domaine. Dans les faits, le terme unifié vaut pour sa capacité à agréger plusieurs fonctionnalités de data science. Le produit est souvent déployé dans quelques départements d’une organisation, selon les retours des utilisateurs sur Gartner Peer Insights.

Puis, il y a des questions de performance et d’erreurs. Les usagers ayant partagé leurs avis sur G2 remontaient quelques bugs et des pertes de données en mémoire après la chute d’un cluster. Le retour le plus commun sur la plateforme concerne son UX, trop brut pour accueillir tous les types de personas que compte une équipe data science ou de data analysts.

Enfin, ce trésor de guerre accumulé en quelques mois pourrait être utilisé pour étoffer l’offre Databricks, même si selon les dires d’Ali Ghodsi, la « startup » ne semble pas avoir trouvé de candidats sérieux ces six derniers mois. « Nous sommes toujours à la recherche de belles entreprises et de technologies qui complètent notre plateforme, et cet argent sera consacré aux efforts de fusion et d’acquisition au fur et à mesure que nous repérerons des opportunités ».

Pour approfondir sur Intelligence Artificielle et Data Science

Close