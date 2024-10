Lors du Snowflake World Tour Paris, Benoît Dageville, cofondateur et président du produit chez Snowflake, est revenu auprès de la presse française sur son combat technico-commercial avec son adversaire préféré, Databricks.

Un combat qui implique le face-à-face entre Delta Lake, soutenu par Databricks et Apache Iceberg, supporté par Snowlfake (et beaucoup d’autres).

Pour rappel, Apache Iceberg est un format de tables ouvert de plus en plus apprécié par les entreprises. La promesse ? Gagner en indépendance par rapport aux fournisseurs de solutions de stockage et de traitement de données. Ce serait également un gage pour les entreprises en provenance du monde Hadoop qui souhaiteraient moderniser leur pile technologique tout en conservant cette forme d’indépendance, selon Benoît Dageville.

« Iceberg est la technologie d’interopérabilité pour les architectures lakehouse. Nos gros clients qui avaient réalisé des investissements majeurs sur Hadoop convergent désormais vers ce format de données et cette architecture », assure-t-il. « Ils veulent utiliser Snowflake comme un des outils de leur écosystème de traitement de données ».

Le rachat de Tabular, un aveu de la supériorité d’Iceberg ? Pour Databricks, offrir un format de tables ouvert n’est pas nouveau. Il a confié son propre format de données, Delta Lake à la Linux Foundation en 2019. Or, certains avantages d’Apache Iceberg, ainsi que le supposé contrôle de Databricks sur Delta, tend à faire pencher la balance pour Apache Iceberg chez plusieurs éditeurs et entreprises. Selon Benoît Dageville, même Databricks s’est rendu compte de la supériorité d’Apache Iceberg. La preuve pour le dirigeant, en marge de l’événement de Snowflake, Data Cloud Summit, Databricks a annoncé l’acquisition de Tabular, l’entreprise embauchant les principaux contributeurs du projet Apache Iceberg. Si Ali Ghodsi, cofondateur et CEO de Databricks, a tôt fait de dissiper l’éventuelle prise de contrôle sur le projet porté par la fondation Apache, il a également évoqué les intentions de son entreprise de rapprocher les deux formats de tables, sans réellement préciser la démarche et renforcer la prise en charge d’Apache Iceberg tel qu’il existe actuellement.

Il ne peut en rester qu’un « Pour la petite histoire, il y a trois formats de données ouverts : Apache Hudi, Delta Lake et Apache Iceberg. Cet Iceberg qui est en train de gagner à mon sens », liste Benoît Dageville. « Le rachat de Tabular annonce la mort de Delta. Ils [Databricks et les entreprises] ont compris que le véritable format open source qui n’est pas à la main d’une entreprise, c’est Iceberg », poursuit-il. « Il n’y a aucun intérêt à une guerre des formats. Ce n’est pas si difficile de prendre en charge l’un ou l’autre des formats de tables, ce n’est qu’une question de petite quantité de métadonnées le tout c’est de se mettre d’accord. Et cette acquisition représente la victoire d’Iceberg », considère Benoît Dageville. « Delta est mort, ça c’est clair. Cela va prendre un peu de temps, mais tous nos clients bougent sur Iceberg », répète-t-il. Certains acteurs, dont Starburst et Dremio ont également fait part de leur préférence pour Iceberg. Pour autant, le développement de Delta Lake se poursuit. La version 4.0 du projet est entrée en préversion cet été. Après de (très) longs mois en préversion, la disponibilité générale d’Apache Iceberg sur Snowflake a été annoncée en juin dernier. Officiellement, sur les 10 249 clients de Snowflake recensés au deuxième trimestre fiscal 2025, « plus de 400 clients utilisent Iceberg » avec de « nouvelles charges de travail », signale Michael Scarpelli, directeur financier de Snowflake, lors de la présentation des résultats financiers. Les investisseurs craignaient que les clients de Snowflake s’appuient sur d’autres briques de stockage. « Nous n’avons pas vu de clients déplacer leurs données hors de Snowflake », affirme le CFO. « Le stockage représente toujours environ 11 % de nos revenus », un taux constant depuis quelques trimestres.