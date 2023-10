L’éditeur a dévoilé ces nouvelles fonctionnalités le 17 octobre lors de Coalesce 2023, une conférence organisée à San Diego.

Basé à Philadelphie, DBT Labs – qui signifie « outil de construction de données » – a été fondé en 2016. L’entreprise a d’abord proposé un ensemble d’outils open source pour la préparation et l’orchestration des données. DBT Labs fournit toujours une version libre de sa plateforme, mais mise désormais sur une offre commerciale en direction des ETI et des grands groupes.

Au cours de l’année écoulée, DBT Labs a conclu de nombreux partenariats afin d’accroître sa visibilité sur le marché et de faciliter au maximum les intégrations avec les outils de gestion et d’analyse des données.

Parmi ceux-ci, l’on peut lister Alation, Starburst et ThoughtSpot. Tableau est un nouveau partenaire.

DBT Labs a dévoilé Semantic Layer pour la première fois fin 2022. Dès le début, l’outil a permis aux utilisateurs de caractériser des données et des métriques dans DBT Cloud, puis d’exécuter des requêtes à partir de plateformes BI, dont ThoughtSpot et maintenant Tableau.

Selon Stewart Bond, analyste chez IDC, les couches sémantiques ont d’abord été mises en avant par les éditeurs analytiques. Ces solutions se sont uniquement concentrées sur la définition des données et non sur celle des métriques. Elles ont été largement utilisées dans des environnements sur site, poursuit-il.

Les couches sémantiques sont des outils qui permettent aux organisations de créer des définitions communes pour les données et les métriques clés, quel que soit le service qui collecte et consomme les données.

L’ère du Data Mesh

Explosion du volume de données ou non, les équipes IT sont souvent débordées par la myriade de tâches liées à la gestion des données. Historiquement, la mise en place de l’analytique en libre-service n’a pas permis de les éliminer, ce qui allonge leur mise à disposition auprès du métier.

Plutôt que de faire des données dans le domaine d’une seule équipe au sein d’une organisation, de nombreuses entreprises adoptent désormais une approche Data Mesh dans laquelle chaque domaine – ou département – est responsable de ses propres données.

Les responsables départementaux des données sont chargés de la supervision, tandis que des outils tels que les catalogues de données relient les différents départements pour permettre le partage des données et la collaboration entre les domaines.

Pour aider les organisations à se décentraliser, DBT Labs a dévoilé la préversion publique de DBT Mesh disponible dans DBT Cloud, un service managé avec lequel les développeurs peuvent créer et déployer des produits de données.

Indissociable de la création de ces produits, DBT Mesh inclut des fonctions de gouvernance telles que le contrôle de l’accès et des versions.

Selon Stewart Bond, il s’agit là d’une expansion pour DBT Labs. Historiquement, l’éditeur s’est concentré uniquement sur la création de pipelines de données. « DBT Mesh est un développement intéressant qui fait passer DBT du statut d’outil de construction de pipelines de données à celui d’aide à la conception de produits de données, qui peut également être une combinaison de plusieurs pipelines, modèles et produits de transformation de données », résume-t-il.

Selon l’analyste, DBT Labs a d’abord été déployé par des utilisateurs qui souhaitaient expérimenter une alternative open source aux plateformes existantes. En conséquence, leur travail ne respectait pas toujours les directives et les normes de l’entreprise qui devaient être intégrées dès la création d’un jeu de données.

Stewart Bond considère donc qu’il est important d’embarquer la gouvernance dans le projet DBT Mesh.

« À mesure que le nombre de projets DBT et de produits de données augmentera, les organisations informatiques et les responsables des données chercheront à assurer la gouvernance », déclare-t-il.

Le Data lineage intégré dans DBT Explorer.

Outre DBT Mesh, la mise à jour de DBT Cloud comprend les éléments suivants :

DBT Explorer, un outil qui permet aux usagers d’observer et de visualiser le cheminement des données, y compris entre les domaines dans une architecture Data Mesh.

Cloud CLI, une fonctionnalité qui permet aux développeurs d’écrire du code non seulement à partir de leur IDE, mais aussi à partir d’une interface de ligne de commande, afin qu’ils puissent travailler à partir de différents appareils et utiliser le logiciel IDE de leur choix.

Des connecteurs pour Microsoft Azure Synapse et Fabric qui permettent aux utilisateurs des produits d’Azure d’accéder aux capacités de transformation de données de DBT Labs.

Associées à DBT Mesh et Semantic Layer, ces fonctionnalités représentent une évolution significative pour DBT Labs, selon M. Bond.

« Avec ces nouvelles fonctionnalités, DBT Labs intègre ses produits dans une plateforme, ce qui l’aidera à… établir une empreinte plus large à travers les départements et des entreprises. Cette approche permettra d’obtenir plus facilement les faveurs de l’IT et du Chief Data Officer », commente-t-il.

Pour M. Maldonado, DBT Mesh est le point fort de la mise à jour de DBT Cloud.

Mike Leone, quant à lui, souligne l’importance des intégrations pour la croissance de DBT Labs au-delà de ses débuts open source.

« Je pense que l’accent mis sur les intégrations reste essentiel pour permettre à un plus grand nombre de clients de profiter de la valeur de DBT Labs », formule-t-il.