Brigida Soriano - Fotolia

Databricks récolte 500 millions de dollars supplémentaires

Le spécialiste du data lakehouse a récemment acquis MosaicML pour 1,3 milliard de dollars et pourrait utiliser ce nouveau capital pour financer des acquisitions et des investissements supplémentaires dans l’IA générative et la mise en qualité des données, selon les analystes.

Databricks a annoncé jeudi dernier une levée de fonds 500 millions de dollars, ce qui porte la valorisation totale du spécialiste de la gestion de données à 43 milliards de dollars. Cela confirme l’information diffusée par Bloomberg à la fin du mois d’août.

Le tour de table de série I fait suite au cycle de financement série H de 1,6 milliard de dollars de Databricks en août 2021 et au cycle de série G de 1 milliard de dollars en février 2021.

T. Rowe Price Associates a mené le dernier tour de table, avec d’autres investisseurs, notamment Andreessen Horowitz, Fidelity Management & Research Company et Franklin Templeton, qui étaient déjà des soutiens financiers de Databricks. Parmi les nouveaux investisseurs figurent Capital One Ventures, le Régime de retraite des enseignants de l’Ontario et Nvidia, le concepteur de puces graphiques et éditeur de logiciels consacrés à l’IA.

Basée à San Francisco, Databricks a participé au développement du concept et de l’architecture Data lakehouse, une appellation marketing trouvée en 2020 pour définir son lac de données doté de capacités ACID.

Un data lakehouse combine les capacités d’un data lake avec celles d’un data warehouse. Cela doit permettre aux utilisateurs de stocker tous les types de données en un seul endroit, de les combiner et d’en faciliter les analyses.

La combinaison de différents types de données est essentielle dans le développement de l’IA générative. En effet, les performances des modèles d’IA dépendent des données utilisées lors de l’entraînement. Plus les données sont complètes et de qualité, plus le modèle sera précis.

Outre Databricks, quelques pure-players se distinguent sur le marché, dont Dremio et Cloudera. Snowflake est un des sérieux compétiteurs. Les géants de la technologie que sont Amazon, Google et Microsoft proposent également des fonctionnalités similaires.

Une levée de fonds dans un contexte dégradé

Si Databricks a continué à attirer des investissements en capital-risque au cours des deux dernières années, le financement de la plupart des éditeurs de solutions de gestion et d’analyse des données a considérablement ralenti depuis le début de l’année 2022. L’inflation a atteint des sommets et les craintes d’une récession ont rendu fébriles les investisseurs.

La valeur des actions dans le secteur de la technologie s’est effondrée au début de 2022, ce qui a contraint des éditeurs tels que Qlik et ThoughtSpot, qui prévoyaient des introductions en bourse, à suspendre leurs projets. Aujourd’hui encore, près de deux ans plus tard, les conditions d’introduction en bourse restent largement défavorables.

« Il y a encore des fonds disponibles pour les éditeurs établis qui bénéficient d’une véritable traction et des opportunités de croissance. »
Matt AslettAnalyste, Ventana Research

Les conditions de financement privé auprès des VC se sont aussi dégradées. Les entreprises bien établies et dotées d’une solide situation financière constituent en quelque sorte une exception, note Matt Aslett, analyste chez Ventana Research. Par exemple, Pyramid Analytics a levé 120 millions de dollars en mai 2022, et Denodo a levé 336 millions de dollars le 13 septembre.

« Bien que le financement par capital-risque puisse être plus difficile à obtenir que ces dernières années, il y a encore des fonds disponibles pour les éditeurs établis qui bénéficient d’une véritable traction et des opportunités de croissance », affirme Matt Aslett. « Databricks se trouve dans cette catégorie avec sa plateforme Lakehouse pour la gestion des données, l’ingénierie des données, le streaming de données et l’IA ».

Selon Databricks, son chiffre d’affaires est en hausse de 50 % d’une année sur l’autre, au deuxième trimestre 2023, terminé le 31 juillet dernier. Son taux de revenus annuels dépasserait 1,5 milliard de dollars et il compte désormais plus de 10 000 clients dans le monde. Pas moins de 300 d’entre eux dépenseraient plus d’un million de dollars par an dans la plateforme.

À titre de comparaison, Snowflake a réalisé un chiffre d’affaires de 2,06 milliards de dollars au cours de l’année fiscale 2023 et estime que les revenus issus de ses produits atteindront 2,6 milliards de dollars d’ici à la fin de l’année fiscale 2024. Snowflake revendique plus de 8 500 clients, dont un peu plus de 400 dépenseraient plus de 1 million de dollars.

L’IA générative et la mise en qualité des données, les pistes d’investissements privilégiées par les analystes

Toutefois, Databricks n’a pas révélé à quoi serviraient les fonds obtenus. En juin, l’éditeur a acquis MosaicML pour 1,3 milliard de dollars afin de permettre aux clients d’entraîner et d’inférer leurs propres modèles d’IA générative. Avant cela, en mars, Databricks a lancé les projets de recherche Dolly et Dolly 2 afin de prouver qu’il était possible d’entraîner à bas coût des grands modèles de langage.

Il est donc logique de s’attendre à ce que Databricks utilise son financement de série I pour continuer à investir dans l’IA générative, selon Doug Henschen, analyste chez Constellation Research.

« Un financement important a permis à Databricks d’acquérir MosaicML plus tôt cette année, mais nous n’en sommes qu’aux balbutiements de l’IA générative. Ce tour de table supplémentaire ne peut pas faire de mal en ce qui concerne le développement organique et les acquisitions éventuelles », déclare-t-il.

Doug Henschen ajoute que Databricks a acquis une expertise et des capacités importantes en matière d’IA générative en rachetant MosaicML. Bien que sa technologie soit intéressante, la startup n’en était qu’à ses débuts.

« L’acquisition de MosaicML a pour but d’aider les clients à développer leurs propres modèles personnalisés, mais… Databricks devra augmenter ses capacités pour servir sa base de clients importante et croissante », note-t-il.

À l’instar de Snowflake, Databricks a développé des verticaux s’appuyant sur sa plateforme. Ceux-ci combinent des bonnes pratiques, des fonctionnalités de gestion et d’échanges de données, ainsi que la mise à disposition d’algorithmes spécifiques. Databricks a commencé avec son Lakehouse pour le retail en janvier 2022. Depuis, d’autres versions de la plateforme s’adressent aux services financiers, aux manufacturiers et à l’industrie pharmaceutique.

« Une piste de développement organique pourrait consister à renforcer les cas d’usage de l’IA générative dans les nombreux verticaux », envisage Doug Henschen. « Les organisations sont attirées par les possibilités de cette technologie, mais elles veulent aussi voir des cas d’usage concrets qui sont pertinents pour leur industrie et leur entreprise ».

 Matt Aslett s’attend également à ce que Databricks utilise le nouveau financement pour continuer à investir dans les capacités d’IA générative.

Mais il y a aussi d’autres domaines dans lesquels l’éditeur serait bien avisé d’investir, poursuit-il. Bien que la plupart des éditeurs de solutions de gestion de données et d’analytique se concentrent sur l’IA générative, la base qui sous-tend cette technologie – la mise en qualité des données – reste essentielle.

« Les données sont le fondement de l’IA, c’est pourquoi une gestion saine et solide des données, des métadonnées et leur gouvernance sont essentielles ».
Doug HenschenAnalyste, Constellation Research

Par conséquent, selon M. Aslett, Databricks serait bien avisé de continuer à ajouter et à investir dans des fonctionnalités telles que son Unity Catalog, un catalogue de données qu’il a introduit pour la première fois en juin 2022.

« Les domaines d’investissement potentiels pour Databricks comprennent l’amélioration de son catalogue de données, de sa couche de gouvernance, le data lineage, la qualité et l’observabilité des données », liste Matt Aslett.

Doug Henschen partage peu ou prou cet avis. Selon lui, Databricks serait bien avisé de se concentrer sur l’investissement dans le renforcement de ses capacités fondamentales, en plus de l’ajout de fonctionnalités d’IA générative.

« Tout ce qui touche à l’IA est sous les feux de la rampe, mais j’aimerais voir Databricks continuer à développer les capacités plus conventionnelles d’entreposage de données et d’analyse qui étaient au centre de l’attention de l’entreprise avant que l’IA générative chamboule son agenda », avance-t-il. « Les données sont le fondement de l’IA, c’est pourquoi une gestion saine et solide des données, des métadonnées et leur gouvernance sont essentielles ».

L’ombre de l’introduction en bourse

Maintenant que Databricks a réalisé cette énième levée de fonds et qu’il dispose des moyens de reporting financier d’une entreprise cotée en bourse, Matt Aslett suggère que l’entreprise pourrait enfin franchir le pas de l’IPO.

Il pourrait suivre le modèle de Snowflake qui a établi un record lors de son introduction en bourse en septembre 2020. Les conditions du marché étaient toutefois plus favorables.

Databricks envisage L’IPO depuis 2019, mais a terminé de s’organiser financièrement comme une entreprise côté en bourse l’année dernière. En 2021, le PDG de Databricks, Ali Ghodsi, évoquait une option, pas une priorité.

Pour approfondir sur Big Data et Data lake

Close