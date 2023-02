Les entrailles de Grail, le lakehouse de Dynatrace

Sous-jacente au service SaaS Dynatrace hébergé sur AWS, la plateforme Grail est une architecture Lakehouse dite « schema-on-read » et sans index. En clair, elle peut ingérer et stocker en mode objet (dans des buckets S3) tout type de données (structurées, semi-structurées ou non structurées) dans divers formats natifs. La structure de données sera appliquée à la lecture. C’est une approche différente de la plupart des acteurs du marché réunis auprès d’AWS pour tenter de démocratiser le schéma OCSF. A contrario de Dynatrace, ces acteurs veulent normaliser les données avant leur ingestion par les plateformes de télémétrie.

Le fait que Dynatrace n’indexe pas les données doit autoriser une plus grande souplesse au moment d’interroger les données. En principe, l’absence d’indexation indique que la plateforme n’a pas besoin que les données soient stockées plusieurs fois, ou réhydratées au moment de rafraîchir les données les plus fréquemment interrogées, placées dans une couche de cache. Cela réduirait le coût de stockage et ne nécessiterait pas de gérer le tiering.

Or l’approche inverse, dite schema-on-write, en combinaison avec l’indexation ont été mis en place pour soutenir la performance de systèmes analytiques de pointe. Les concurrents de Dynatrace, dont Splunk, s’appuient sur ces techniques.

Pour assurer un niveau de performance similaire (voire supérieur selon ses dires), Dynatrace a adopté un moteur de traitement massivement parallèle (MPP). Il est couplé à son langage de requêtes DQL (Dynatrace Query Language), inspiré de Splunk SQL, et donc du SQL, mais aussi de GraphQL. DQL est voué à remplacer son ancien langage LQL dans ce contexte. Cela permet d’interroger les données à la volée, en quasi-temps réel et d’appliquer les règles du moteur Davis dans la même temporalité.

Ainsi, en façade de Grail, un point de terminaison permet d’ingérer les données qui sont transformées et enrichies avec des champs additionnels à travers un pipeline, puis stockées dans des tables lisibles par DQL au sein de buckets S3.

Bernd Greifeneder affirme que l’architecture en question peut stocker et traiter « 1 000 pétaoctets par jour ». De manière plus réaliste, les ingénieurs de l’éditeur précisent que les clients peuvent ingérer 100 téraoctets de données par jour par tenant. Grail peut traiter un téraoctet de données en une seconde, mais pour cela le moteur MPP exploite 1 000 cœurs.

Si Dynatrace ne semble pas proposer d’options de stockage à froid, il est possible de déterminer la durée de rétention des logs (par défaut 35 jours, 1 an ou 3 ans). L’éditeur ne dit pas si lui-même utilise les fonctions de tiering automatisées de certains services de stockage objet.

L’éditeur a bien compris que s’il souhaite devenir la plateforme unique de traitement de données pour les équipes de sécurité, il ne peut plus compter seulement sur OneAgent. Comme il avait déjà commencé à le faire, l’éditeur prend en charge plusieurs API, dont les collecteurs OpenTelemetry.

S’il prétend que son approche est moins coûteuse, Dynatrace facture bien un nombre de crédits à l’ingestion, au stockage (certaines données peuvent être ingérées, mais non stockées) et à la requête suivant le volume traité, exprimé en gigaoctet. Il est donc difficile de dire actuellement si la solution coûte moins cher.