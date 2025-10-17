Dbt Labs a dévoilé mardi une version mise à jour de son moteur Fusion, un remplaçant de dbt Core, dans son produit commercial.

En outre, le fournisseur a dévoilé dbt Agents, un ensemble de fonctionnalités basées sur l’IA, intégrée à la plateforme dbt Labs. Elles doivent aider les utilisateurs à effectuer des tâches telles que la découverte et la surveillance de la qualité des données.

La mise à jour Fusion et les agents dbt ont été dévoilés lors de Coalesce, la conférence annuelle des utilisateurs de dbt Labs à Las Vegas.

Fusion, lancé en mai, est actuellement en phase de préversion pour les charges de travail sur Amazon Redshift, Databricks, Google BigQuery et Snowflake.

Dbt Fusion est un moteur propriétaire dont le rôle est d’exécuter des charges de travail de transformation des données. Il est écrit en Rust et non plus en Python, contrairement à dbt Core.

Fusion permet désormais aux utilisateurs de créer des pipelines optimisés qui créent et gèrent des tables Apache Iceberg dans Databricks et Snowflake. Il exécute des charges de travail sur site et dans des clouds privés pour un contrôle accru par rapport aux clouds publics. Par ailleurs, il intègre des définitions sémantiques et la traçabilité des données en vue d’améliorer la qualité des données.

Jusqu’à 30 % d’économie avec le moteur Fusion Autre point notable, la mise à jour de dbt Fusion ajoute une orchestration sensible à l’état. Elle doit réduit les coûts de calcul inutiles en garantissant que les pipelines de données n’exécutent que les modèles qui ont changé lors de l’entraînement et de la mise à jour des applications. Plus précisément, dbt Fusion ne recrée pas les modèles de données des tables cibles (transformées) au sein de son DAG (graphe acyclique dirigé). Au lieu de ça, il ne traite pas ceux qui n’ont pas besoin d’être changés. Cela permettrait d’économiser 10 % des coûts, selon les tests effectués avec la cohorte de bêta-testeurs. Le moteur permet aux équipes data d’affiner les pipelines de données en définissant des exigences de fraîcheur des données que l’orchestration sensible à l’état respecte tout en déterminant le chemin d’exécution des tâches optimal. La cohorte de testeurs aurait obtenu un gain annuel supplémentaire minimum de 15 %. L’amélioration des tests agrégés sensibles aux colonnes et de la CI permettrait encore de « gratter » 4 % des coûts, pour un total « potentiel » de 29 %. « Le moteur Fusion est né du constat que nous avions atteint les limites de ce que nous pouvions faire avec le code source original de dbt Core », explique M. Handy. Les commentaires des clients ont également joué un rôle dans la décision initiale de dbt Labs de développer un nouveau moteur, poursuit-il. Le dirigeant assure que les utilisateurs recherchent toujours des performances plus rapides et des coûts plus bas. Mais la principale motivation pour créer dbt Fusion part du constat que l’architecture d’origine du fournisseur, construite en 2016, ne répondait plus aux besoins des charges de travail de 2025. L’écriture du moteur en Rust permettrait de parser 30 fois plus rapidement les données que dbt Core. « Notre véritable motivation était de reconnaître que nous ne pouvions pas simplement nous contenter d’itérer pour aller vers l’avenir, surtout compte tenu de la rapidité avec laquelle les choses évoluent avec l’IA et les normes ouvertes comme Iceberg », affirme Tristan Handy. Comme Fusion ajoute désormais des fonctionnalités qui aident les clients à contrôler leurs coûts, il présente un intérêt réel pour les clients, remarque Donald Farmer, fondateur et directeur de TreeHive Strategy. « Les coûts du cloud sont une priorité pour de nombreux DSI, en grande partie en raison de l’augmentation de l’échelle de l’IA, de l’analytique et des charges de travail liées aux données », déclare-t-il. « Cette annonce arrive donc à point nommé, d’autant plus que dbt a été critiqué par les utilisateurs pour la lenteur de l’exécution des projets de grande envergure ». L’orchestration sensible à l’état, quant à elle, est un moyen logique pour dbt Labs de maîtriser les coûts et d’améliorer les performances, poursuit l’analyste. « L’orchestration sensible à l’état est tout à fait logique », considère-t-il. « Auparavant, ce processus nécessitait beaucoup de travail manuel, donc les utilisateurs devraient être satisfaits si cela est bien fait ». Les gains semblent pour l’instant dépendre de la stratégie de rafraîchissement de données.

Quatre premiers agents IA pour les ingénieurs de données Parallèlement, les quatre premiers agents IA de dbt font leur apparition. Ils sont ou seront accessibles via le serveur distant Model Context Protocol de dbt Labs. Le serveur MCP est en disponibilité générale et intègre des outils liés au moteur Fusion. Les agents IA sont les suivants : Developer Agent : un assistant bientôt disponible pour expliquer les modèles de données et de les valider avant un merge.

Un futur agent d’observabilité pour surveiller la qualité des données, identifier les causes profondes des erreurs et des changements, et proposer des corrections dans les pipelines de données.

Un agent de découverte, en bêta permettant de trouver les jeux de données appropriés à partir d’une requête en langage naturel.

Un agent analyste (en bêta également) pour répondre aux questions sur les modèles, les tâches et les métriques. De nombreux fournisseurs ajoutent désormais des agents à leurs plateformes, DBT Labs n’est pas le premier, rappelle Donald Farmer. Et il n’était pas en avance l’année dernière. Cependant, comme la transformation des données implique plus de tâches routinières que certains autres processus de gestion des données, les agents sont les bienvenus. « Ce sont exactement les tâches que les agents devraient prendre en charge », avance Donald Farmer. William McKnight, analyste et dirigeant du cabinet McKnight Consulting Group, souligne que les agents Developer et Observability seront peut-être les plus importants pour les utilisateurs. « L’agent Developer se distinguera en automatisant des tâches telles que la création, la refonte et la validation de code, ce qui permet d’accélérer le processus tout en maintenant la qualité et la confiance », explique-t-il. « L’agent Observability est important, car il automatisera l’identification des problèmes et la proposition de solutions, ce qui réduit le travail de correction manuel et prend en charge l’IA régulée et une infrastructure de données fiable. » Pour autant, l’ensemble de ces fonctionnalités ne sont pas disponibles ou en préversion. Quoiqu’en dise dbt qui prétend que des milliers d’équipes sont en train d’adopter son nouveau moteur.