En acquérant Metaplane, Datadog parie sur l’observabilité de données
Datadog évoque des clients qui intègrent déjà la data science aux processus DevOps. Avec sa dernière acquisition en date, l’éditeur vise à créer un ensemble d’outils unifiés adaptés à ce point de convergence naissant.
La transformation numérique et l’IA poussent certaines entreprises à consolider les équipes de data science et DevOps, ont déclaré les responsables de Datadog. L’éditeur prévoit de leur offrir une suite d’observabilité des données intégrée à sa plateforme plus tard cette année, sur la base de son acquisition de Metaplane.
Metaplane, startup fondée à Boston en 2019, utilise le machine learning pour signaler automatiquement les problèmes de qualité et de livraison des données dans les systèmes d’entrepôt de données de grande taille tel que Snowflake. Les deux entreprises partagent des clients communs, mais ont refusé d’en préciser le nombre. Les concurrents de Metaplane dans le domaine de l’observabilité des données sont Acceldata, Monte Carlo ou encore Soda Data.
Le fondateur de Metaplane, Kevin Hu, et son équipe d’ingénieurs rejoindront Datadog et réécriront le logiciel pour qu’il fonctionne sur la plateforme de Datadog. Les conditions financières de la transaction n’ont pas été divulguées.
DevOps, DataOps, LLMOps : même combat, selon Datadog
Datadog a choisi d’acquérir Metaplane parce qu’elle est à la fois désireuse et capable de réécrire ses outils pour qu’ils fonctionnent sur Datadog, selon Michael Whetten, vice-président des produits chez Datadog. Pour l’instant, Metaplane continuera à soutenir les clients existants sous le nom de Metaplane by Datadog, mais M. Whetten a indiqué que le portage de la suite sur la plateforme Datadog sera réalisé dans le courant de l’année. Après cela, les clients devront passer à Datadog pour continuer à utiliser l’observabilité des données de Metaplane.
« Il y avait une indication que ces choses évoluaient de la simple business intelligence, qui est toujours critique, vers des opérations en temps réel à l’échelle ».
Michael WhettenV-P produits, Datadog
L’accord a été conclu parce que Datadog a déjà vu certains clients réunir les équipes DataOps et DevOps et commencer à demander des outils unifiés au cours de l’année dernière, avance Michael Whetten.
« Nous avons vu que les ingénieurs et les équipes de données commençaient à consolider les budgets sous la responsabilité du CTO et de l’équipe d’application », répète Michael Whetten lors d’une interview avec Informa TechTarget. « Il y avait une indication que ces choses évoluaient de la simple business intelligence, qui est toujours critique, vers des opérations en temps réel à l’échelle ».
Cela va de pair avec l’émergence d’une approche nommée « data as code », plus connue des ingénieurs de données. Celle-ci consiste à ne plus utiliser forcément les interfaces WYSIWYG des ETL, mais plutôt de configurer les pipelines de données et le déploiement des algorithmes à l’aide de manifestes ou d’outils d’infrastructure as code.
Metaplane fait part de demandes de clients désireux de couvrir une plus grande partie de l’infrastructure IT utilisée pour le traitement des données, y compris les outils de pipeline de données tels qu’Apache Kafka, selon Kevin Hu.
« Les données proviennent de quelque part – d’un système ou d’une entrée humaine – et malheureusement, Metaplane et la cohorte actuelle de clients de l’observabilité des données n’ont tout simplement pas cette visibilité », note Kevin Hu. « Nous ne sommes pas connectés au flux Kafka. Nous ne sommes pas connectés à la base de données en amont ou aux systèmes logiciels en amont. Ainsi, lorsque nos clients posent naturellement la question “Que s’est-il passé ?”, nous n’avons tout simplement pas de réponse ».
En fin de compte, l’infusion de Metaplane dans Datadog apportera plus de valeur ajoutée aux utilisateurs, ajoute-t-il.
« Nous ne savons pas exactement à quoi cela va ressembler ou quelle forme cela va prendre, mais nous avons maintenant des données pour savoir exactement ce qui s’est passé », estime Kevin Hu. « Et si vous programmez des logiciels ou si vous faites partie d’une équipe DevOps, vous pouvez répondre à la question inverse : “Que se passera-t-il si j’effectue ce changement ?”, ce qui permet d’avoir une vue d’ensemble ».
Un signe avant-coureur des fusions-acquisitions à venir ?
Il pourrait s’agir de la première grande acquisition de ce type, afin de fusionner les outils utilisés par les équipes chargées des données et les outils utilisés par les équipes IT. »
Gregg SiegfriedAnalyste, Gartner
Les analystes du secteur n’ont pas encore vu de consolidation entre les équipes de data science et DevOps à grande échelle, mais n’écartent pas la possibilité que cela devienne une tendance à mesure que l’hygiène des données et les techniques DataOps jouent un rôle plus important dans le développement et la maintenance des applications d’IA générative et d’IA agentique.
« Il pourrait s’agir de la première grande acquisition de ce type, afin de fusionner les outils utilisés par les équipes chargées des données et les outils utilisés par les équipes IT qui, autrement, auraient appartenu à des mondes différents », affirme Gregg Siegfried, analyste chez Gartner. « Je m’y attends en quelque sorte, à mesure que l’intérêt pour l’IA augmente, à ce que ces mondes séparés ne le soient plus ».
Dynatrace, le concurrent de Datadog, a ajouté des fonctions d’observabilité des données à sa plateforme avec relativement peu de publicité au cours des 18 derniers mois, d’après Gregg Siegfried. New Relic s’intéresse également au LLMOps.
« Cela pourrait être le signe que des choses plus importantes se préparent », anticipe-t-il. « Il se peut que d’autres entreprises spécialisées dans l’observabilité des données soient rachetées par des éditeurs de solutions d’observabilité, si cela devient un [différentiateur] concurrentiel ».
Que les équipes de data science et DevOps se consolident ou non, les ingénieurs de plateforme et les SRE doivent tenir compte des entrepôts et des plateformes analytiques lorsqu’ils dépannent des applications axées sur le machine learning ou l’IA générative. Une mauvaise qualité des données peut aussi conduire à de mauvais résultats en matière d’automatisation avec l’IA.
« Les grands modèles de langage sont désormais des composants essentiels des architectures d’applications modernes, et [...] donc être une extension naturelle dans ce domaine du développement logiciel. »
Chris CondoAnalyste, Forrester Research
« À l’ère de l’IA, l’hygiène des données est devenue très importante », rappelle Chris Condo, analyste chez Forrester Research. « Les grands modèles de langage sont désormais des composants essentiels des architectures d’applications modernes, et cela semble donc être une extension naturelle dans ce domaine du développement logiciel ».
La business intelligence et l’observabilité des opérations ont pris une importance croissante pour les entreprises au cours des dix dernières années – tout comme l’observabilité dans son ensemble –, ce qui a conduit à un besoin accru d’outils capables de gérer les données à grande échelle, comme les data warehouses, souligne Michael Whetten.
« L’intelligence artificielle permet bien sûr de franchir un nouveau cap, [mais] le simple fait de migrer vers le cloud et d’adopter des technologies comme les outils d’orchestration de conteneurs génère déjà une quantité nettement plus importante de données de télémétrie », explique-t-il. « En ce qui concerne la croissance du Big Data, si l’on observe ce que les entreprises stockent dans leurs entrepôts de données, c’est aussi parce que l’interaction des utilisateurs et la nature des logs d’utilisation et d’accès qu’ils collectent ne cessent d’augmenter ».
Pour approfondir sur Outils décisionnels et analytiques