AIOps : Dynatrace ajuste sa plateforme pour surveiller les infrastructures cloud

Dynatrace a présenté les nouvelles fonctionnalités de sa plateforme AIOps Dynatrace AI. L’éditeur veut offrir la surveillance complète de la stack Kubernetes et d’autres environnements cloud.

Dynatrace Perform 2020—Las Vegas. Kubernetes est un standard qui serait déployé par 83 % des entreprises selon IDC. L’orchestrateur sert autant à supporter des infrastructures, gérer le stockage de données, qu’à déployer des applications sous forme de microservices.

Cette brique d’automatisation a pourtant besoin d’être surveillée de très près, comme tous les autres composants IT. Pour cela, les entreprises ont besoin d’outils de monitoring. AppDynamics, Elastic et d’autres veulent fournir les outils nécessaires pour gérer des architectures microservices de plus en plus complexes.

Parmi ces acteurs, Dynatrace mise sur l’automatisation de la surveillance des applications, des PaaS et des infrastructures avec Davis AI. Cette technologie, développée depuis près de quatre ans, est disponible depuis février 2017.

D’après les dirigeants et les responsables techniques, Dynatrace veut poursuivre l’automatisation des procédures de monitoring du plus bas niveau de l’infrastructure jusqu’au suivi des indicateurs économiques au sein d’une entreprise. La plateforme détecte automatiquement les métriques, puis les interdépendances entre les applications, les microservices, les clusters et les hôtes associés.

La plateforme de Dynatrace ingérait déjà des logs, des traces, des métriques et des métadonnées en provenance de Kubernetes, mais ne supportait pas l’observabilité automatisée de la full stack. C’est maintenant le cas. « Au cours des six derniers mois, nous avons observé que le déploiement de Kubernetes a doublé chez nos clients », précise Florian Ortner, Chief Product Officer chez Dynatrace. Selon un sondage réalisé par l’éditeur auprès de 800 DSI, 68 % des entreprises clientes de Dynatrace utilisent déjà des containers, et 86 % de ces responsables comptent les déployer dans les 12 mois à venir.

Surveiller la full stack Kubernetes depuis une seule plateforme

L’outil AIOps Davis AI doit ingérer automatiquement les informations concernant les événements, en provenance des containers, des clusters, des workloads et des runtimes associés à la stack Kubernetes. L’objectif est évidemment d’étudier les changements d’état des différents processus afin d’alerter rapidement les équipes DevOps. L’outil découvre également les outils et les environnements associés comme les images Docker déployées, Openshift et les interfaces CRI-O.

Dynatrace entend améliorer les capacités d’analyse de son outil « AIOps ». L’algorithme d’automatisation basé sur un arbre de défaillances a été ajusté pour « comprendre » les spécificités du fonctionnement de Kubernetes et les interdépendances entre les services. Par exemple, un pod ne peut pas crasher parce que le CPU ne fournit pas assez de puissance, en revanche, cela peut arriver en cas de manque de mémoire vive, selon Florian Ortner.

Lire aussi

NoOps : face à la confusion des clients, Dynatrace se concentre sur l’observabilité
Dynatrace vante l’automatisation des opérations IT, mais les clients se posent encore des questions sur son outil AIOps de surveillance « intelligente ». Conscient de la situation, l’éditeur souhaite avancer prudemment.

Les développeurs peuvent surveiller la santé des pods et des nœuds Kubernetes avec l’interface de ligne de commande kubectl, plus particulièrement avec la commande describe. Celle-ci donne les mêmes types d’informations comme l’utilisation de la RAM et des CPU, mais elle n’indique pas la cause d’un problème. Les responsables de Dynatrace expliquent, démonstration à l’appui, qu’il est possible de surveiller des environnements des distributions Kubernetes déployés depuis plusieurs services cloud, ici Azure Kubernetes Service (Microsoft) et Elastic Kubernetes Service (AWS), depuis un seul tableau de bord.

« Nous ne prenons pas tout en charge à la demande [des clients], mais nous supportons tout l’écosystème Kubernetes, ce qui induit la compatibilité de OneAgent avec cet environnement », assure Florian Ortner.

Dynatrace entend également élargir l’observabilité d’autres environnements cloud natives pour faciliter la surveillance des infrastructures modernes. L’outil d’indexation automatique de métriques OneAgent ingère les données en provenance de nouvelles sources comme les services d’AWS, de Microsoft Azure, les métriques aux formats Prometheus, OpenMetrics et Spring Micrometer. OneAgent dispose maintenant de plugins pour les logs en provenance de Cassandra, activeMQ, Apache Solr, Hadoop, Kafka et Spark. Tous les services d’Azure et d’AWS seront pris en charge au deuxième trimestre 2020.

Quelques limites à prendre en compte

Par ailleurs, la plateforme doit faciliter la conception de métriques personnalisées pour « n’importe quel » script, application, et processus qui produit des fichiers de logs réduisant de la sorte la gestion manuelle. Toutefois, leur intégration demande encore une intervention humaine. L’utilisateur nomme et décrit la métrique qu’il veut suivre, la sélectionne dans un menu déroulant, puis l’associe à une catégorie de composants (hôtes, services, plateforme cloud, etc.). Ensuite, un moteur de règles permet de sélectionner le nombre d’hôtes sur lesquels est surveillée la métrique.

Le moteur Davis AI fournit automatiquement des algorithmes, pour indiquer les valeurs attendues et les seuils à ne pas dépasser, en se servant des historiques de données associés à une métrique. De la sorte, les entreprises doivent en principe recevoir des réponses sur les causes d’un problème « en temps réel ». En réalité, la détection et la remontée d’un problème prennent environ cinq minutes selon Wolfgang Beer, Technical Product Manager, chez Dynatrace. La documentation de l’éditeur précise que la génération d’alertes avec le plus haut niveau de confiance demande d’attendre 15 minutes.

Pour approfondir sur DevOps et Agilité

Close