
REDPIXEL - stock.adobe.com
ELT : Fivetran et dbt Labs confirment leur fusion
Fivetran est à la manœuvre de cette fusion-acquisition dont les contours étaient apparus dans la presse il y a quelques semaines. Si le rapprochement de ces éditeurs est logique, l’opération provoque du remue-ménage dans le petit monde de la gestion de données.
L’information circulait depuis plus de deux semaines. Fivetran et dbt viennent de confirmer leur fusion pour un montant non divulgué. La transaction est entièrement en part. The Information était le premier à évoquer un accord à « plusieurs milliards de dollars » entre ces deux sociétés soutenues par Andreessen Horowitz. Tant que la fusion n’a pas été approuvée par les autorités compétentes, les deux sociétés demeurent indépendantes.
Une fois l’opération finalisée, George Fraser, actuel CEO de Fivetran, prendra ce rôle au sein de l’entité combinée. Tristan Handy, fondateur de dbt Labs, sera nommé à la présidence de la société et gardera le rôle de cofondateur. Fivetran est à la manœuvre.
En septembre 2021, Fivetran était valorisé 5,6 milliards de dollars après une levée de fonds de 565 millions de dollars. Dbt Labs, lui, affichait une valorisation de 4,2 milliards de dollars après une collecte de 222 millions en février 2022. L’entreprise combinée devrait pouvoir revendiquer un revenu annuel récurrent proche des 600 millions de dollars et plus de 10 000 clients.
Pour mémoire, Fivetran est un expert de l’ingestion de données. Il s’occupait principalement des parties EL (extraction, chargement) du segment ELT (extraction, chargement, transformation). L’acteur a pris l’ampleur à partir de 2021 après son rachat de HVR, un spécialiste de la réplication de données. Plus récemment, il a mis la main sur Census, une startup développant une solution de Reverse ETL (pour renvoyer les données transformées vers les applications). En septembre, Fivetran a annoncé le rachat de Tobiko Data, l’entreprise derrière SQLMesh, un framework de DataOps et de transformation de données. SQLMesh est considéré comme une alternative à dbt Core.
Dbt était déjà le principal moteur de transformation utilisé par les clients de Fivetran. Dbt a acquis sa réputation auprès des ingénieurs de données et des data analysts en lançant dbt Core, un framework open source. La distribution commerciale prend la forme d’une plateforme cloud, dont les derniers développements ont principalement été porté sur l’apport d’une couche sémantique pour les outils de BI et les LLM.
Orchestration, observabilité, métadonnées et sémantique, ingestion de données, reverse ETL, catalogue de données, gouvernance et même stockage de données. Voilà l’ensemble des domaines qu’entendent les deux acteurs après la combinaison.
Une démarche approuvée par les analystes.
ELT : avec dbt, Fivetran ajoute le T qui lui manquait
« Cet accord est judicieux à plusieurs égards », déclare Kevin Petrie, analyste chez BARC US. « Fivetran et dbt sont des partenaires de longue date […]. Les deux entreprises ont bâti des activités solides, notamment en aidant les entreprises à consolider et à préparer des données provenant de sources multiples pour les analyser dans des data lakehouses dans le cloud ».
« Je pense que c’est une excellente transaction », affirme pour sa part Sanjeev Mohan, fondateur et analyste au sein du cabinet Sanjmo. « Fivetran est très performant en matière d’ingestion de données et, avec Census, a ajouté l’ETL inversé, mais ils [les clients] devaient passer par dbt pour transformer les données. Fivetran a racheté Tobiko, mais dbt est le géant incontournable dans ce domaine. Désormais, Fivetran a bouclé le cycle de vie de l’ingestion, de la modélisation, de la transformation et de l’ETL inversé. C’est une bonne chose. »
Malgré les avantages potentiels liés au regroupement de capacités complémentaires, cette fusion présente également des inconvénients potentiels, selon M. Petrie. Alors que Fivetran et dbt Labs intègrent leurs technologies et leurs cultures respectives, des concurrents tels que Coalesce et Qlik pourraient profiter de la période d’ajustement pour accroître leur part de marché.
« Les grandes fusions et acquisitions génèrent des perturbations organisationnelles et des guerres de territoire », souligne Kevin Petrie. « Ce défi inévitable crée une opportunité à court terme pour les concurrents de gagner des parts de marché. À long terme, je pense que la combinaison de ces deux entités sera couronnée de succès. »
Par ailleurs, une fois que Fivetran et DBT Labs auront uni leurs forces, l’entité combinée devra améliorer ses capacités de gouvernance si elle veut attirer de nouveaux utilisateurs.
« Fivetran et dbt pourraient devenir le nouvel Informatica, c’est-à-dire la Suisse de la gestion des données, alors qu’Informatica va être intégré à Salesforce dans les mois à venir », rappelle l'analyste chez BARC US. « Mais pour remplir ce rôle, ils devront renforcer leurs capacités en matière de gouvernance des données, par exemple en acquérant un fournisseur d'observabilité des données ».
D’autres voient là un moyen de contrer les initiatives de Databricks, Snowflake et Microsoft. Ces trois acteurs sont en train de bâtir des plateformes d’ingestion et de transformation de données de bout en bout.
« Ma principale conclusion est que dbt Labs et Fivetran sont en train de créer une force capable de contrer les "LakeOpenFlowFactories" spécifiques aux plateformes Snowflake, Databricks, BigQuery et Microsoft Fabric », écrit Mikko Sulonen, CTO et architecte de données chez Recordly, un cabinet de consultance finlandais spécialisé dans l’ingénierie de données.
Fivetran et dbt développeraient un « ensemble unique d'outils et la possibilité d'utiliser n'importe quel moteur avec les données dans Apache Iceberg. Ce qui a commencé avec la plateforme dbt Mesh a évolué vers quelque chose d'intéressant », estime le CTO de Recordly.
Dbt Core demeure open source, mais les deux acteurs ne dissipent pas les craintes
Outre le rassemblement de fonctionnalités de gestion de données "essentielles" à l’ère de l’IA générative, Fivetran et dbt affirment que leur unification « établit la norme en matière d'infrastructure de données ouvertes, une nouvelle approche qui réduit la complexité technique en automatisant la gestion des données de bout en bout ».
Or la fusion fait craindre aux utilisateurs de dbt Core une dépréciation du projet open source. Un risque que les deux acteurs ont anticipé.
« Dans le cadre de cette transaction, la société s'engage à maintenir dbt Core ouvert sous sa licence actuelle et à le gérer avec et pour la communauté, afin de garantir le dynamisme de son développement », promettent-ils dans un communiqué de presse conjoint.
Fivetran a adopté une approche Open Core, mais n’a pas ouvert ses propres outils. Sa principale contribution tient en l’apport d’une centaine de packages open source pour dbt.
Cela n’empêche pas une certaine méfiance de la part des internautes, comme en témoigne un forum de Hackernews.
« Cela soulève une question importante : quelle influence réelle cette fusion aura-t-elle sur l'équilibre des principes de l'open source à l'avenir ? », s’interroge sur LinkedIn Moez Rabai, responsable des missions Data et IA chez Groupama.
À noter que dbt Labs est lui-même en train de changer de moteur principal. Il passe de dbt Core, sur base Python, à dbt Fusion, sur base Rust. Quand Core est sous licence Apache 2.0, Fusion a quelques composants sous la même bannière. La majorité du code répertorié l’est sous la licence propriétaire permissive Elastic License 2.0.
Dbt assure qu’il continuera de corriger les bugs, les éventuels problèmes de sécurité, portera les changements d’expression et favorisera les contributions communautaires dans dbt Core.
Les autres acteurs du marché sont également critiques. Pour d’autres raisons.
« Cet accord ne concerne pas la technologie. Fivetran a déjà abandonné dbt en interne (au profit de SQLMesh), la décision technologique a été prise », juge Benjamin Didji, cofondateur et CEO de Popsink, un concurrent français de Fivetran sur le volet de la réplication de données. « Ce qu'ils achètent, ce sont des utilisateurs, pas de l'innovation. C'est un moyen de justifier les multiples de valorisation et de préparer le terrain pour une introduction en bourse (fondée sur la croissance du nombre d'utilisateurs grâce à la consolidation plutôt qu'à l'expansion organique) ».
Mais il y a un autre enjeu. Bien que pratique, les usagers perçoivent les solutions de Fivetran comme chères. Un changement récent de modèle tarifaire a renforcé cette perception. La crainte de subir une hausse des prix des deux solutions est palpable.
« Comme le montre l’histoire (Qlik + Talend, Cloudera + Hortonworks, Informatica + IICS,...), la consolidation profite rarement aux utilisateurs. Les prix augmentent, l’interopérabilité diminue et la « pile de données moderne » devient un peu moins ouverte », conclut Benjamin Didji.