Definition

AIOps (intelligence artificielle dédiée aux opérations informatiques)

Cette définition fait partie de notre Guide Essentiel : Observabilité : comment le machine learning fait évoluer les outils

AIOps (intelligence artificielle dédiée aux opérations informatiques) est un terme générique qui fait référence à l'utilisation d'outils comme l'analytique des Big Data, l'apprentissage automatique et d'autres technologies d'intelligence artificielle (IA, AI)  pour automatiser l'identification et la résolution de problèmes informatiques courants. Dans une grande entreprise, les systèmes, services et applications génèrent un volume colossal de journaux et de données de performance. L'AIOps exploite ces données pour surveiller les ressources et mieux suivre les dépendances sans avoir recours aux systèmes informatiques.

Une plateforme AIOps doit offrir aux entreprises les trois avantages suivants :

  1. Automatisation des tâches de routine

Par tâche de routine, on entend les requêtes des utilisateurs ainsi que toutes les alertes non critiques des systèmes informatiques. Par exemple, l'AIOps peut aider un système d'assistance technique à répondre à une requête utilisateur pour le provisioning automatique d'une ressource. Les plateformes AIOps peuvent également examiner une alerte et décider qu'aucune action n'est requise, lorsque les métriques et les données disponibles s'y rapportant sont dans les limites de la normale.

  1. Détection plus rapide des problèmes et avec plus de précision que les humains

Si les professionnels de l'informatique savent faire face à un programme malveillant connu sur un système non critique, un téléchargement ou un processus inhabituel démarrant sur un serveur critique risque de leur échapper, simplement parce qu'ils ne se méfient pas de cette menace. L'AIOps gère cette situation différemment. Elle s'intéresse en priorité à l'événement constaté sur le système critique, le jugeant comme une attaque ou une infection potentielle du fait d'un comportement hors norme, et relègue au second plan le programme malveillant connu, laissant cette tâche à un logiciel de protection prévu à cet effet.

  1. Interactions simplifiées entre les groupes et équipes du datacenter.

L'AIOps fournit à chaque groupe informatique fonctionnel les données et les perspectives qui l'intéressent. Si les opérations ne sont pas pilotées par l'IA, les équipes doivent partager, analyser et traiter les informations en se réunissant ou en s'échangeant manuellement les données. L'AIOps doit apprendre à distinguer les données d'analyse et de surveillance à transmettre à chaque groupe ou équipe parmi des milliers de mesures de ressources.

Technologies AIOps

L'AIOps exploite différentes stratégies d'intelligence artificielle, notamment la production de données, l'agrégation, l'analytique, les algorithmes, l'automatisation et l'orchestration, l'apprentissage automatique et la visualisation. La plupart de ces technologies sont relativement bien définies et matures.

Les données AIOps proviennent des fichiers journaux, des métriques et des outils de surveillance, des systèmes de gestion d'incidents du support technique, et d'autres sources encore. Les outils Big Data agrègent et organisent les résultats de tous les systèmes sous forme exploitable. Les techniques analytiques peuvent interpréter les informations brutes pour créer de nouvelles données et métadonnées. L'analytique filtre le bruit (données inutiles ou sans fondement) et fait ressortir des tendances et des schémas qui permettent à l'outil d'identifier et d'isoler les problèmes, de prévoir la demande de capacité et de gérer d'autres événements.

L'analytique exige également des algorithmes pour codifier l'expertise informatique, les politiques et les objectifs métier de l'organisation. Grâce aux algorithmes, une plateforme AIOps est en mesure de proposer les actions ou résultats les plus souhaitables. Les algorithmes aident l'équipe informatique à hiérarchiser les événements liés à la sécurité et à enseigner à la plateforme les décisions à prendre pour optimiser la performance applicative. Les algorithmes constituent le socle de l'apprentissage automatique. La plateforme établit des activités et des comportements normaux de référence, puis évolue ou crée de nouveaux algorithmes au fur et à mesure que les données environnementales changent.

L'automatisation est une technologie sous-jacente indispensable à l'efficacité des outils AIOps. Des fonctions automatisées se déclenchent selon les résultats de l'analytique et de l'apprentissage automatique. Supposons par exemple que l'analytique prédictive et l'apprentissage automatique d'un outil déterminent qu'une application a besoin de plus de capacité de stockage. Un processus se déclenche alors automatiquement pour ajouter du stockage par incréments conformes aux règles de l'algorithme.

Pour finir, les outils de visualisation proposent, entre autres, des tableaux de bord, des rapports et des graphiques faciles à interpréter, pour que les utilisateurs suivent les modifications et les événements dans l'environnement. Grâce à ces visualisations, les humains peuvent réagir aux informations exigeant des capacités de prise de décision que n'a pas le logiciel AIOps.

Avantages et inconvénients de l'AIOps

Avec une mise en oeuvre et une formation adaptées, une plateforme AIOps permet à l'équipe informatique de consacrer moins de temps et d'efforts aux alertes de routine quotidiennes. Le personnel informatique enseigne les premiers gestes aux plateformes qui évoluent ensuite, grâce aux algorithmes et à l'apprentissage machine, pour mettre à jour les connaissances acquises au fil du temps et améliorer le comportement et l'efficacité du logiciel. Les outils AIOps assurent également une surveillance continue, sans avoir à se reposer ou dormir. Les humains du service informatique peuvent ainsi se consacrer aux problèmes plus graves et complexes, ainsi qu'aux initiatives visant à accroître les performances et la stabilité de l'entreprise.

Les logiciels AIOps sont en mesure d'observer les relations de cause à effet entre différents systèmes, services et ressources, en agrégeant et corrélant des sources de données disparates. Ces capacités d'analyse et d'apprentissage automatique permettent aux logiciels de procéder à une analyse poussée des causes profondes, ce qui accélère l'identification et la résolution de problèmes difficiles et inhabituels.

L'AIOps améliore la collaboration et les flux de travail entre les groupes informatiques, et entre l'informatique et les autres divisions opérationnelles. Munies de rapports et de tableaux de bord personnalisés, les équipes comprennent rapidement les tâches et obligations qui leur incombent, et dialoguent entre elles sans avoir à apprendre tout ce que l'autre équipe doit savoir.

Bien que les technologies sous-jacentes de l'AIOps soient arrivées à maturité, il reste encore beaucoup à faire pour les combiner et les mettre en application dans la pratique. La qualité de l'AIOps dépend des données reçues et des algorithmes appris. L'implémentation, la maintenance et la gestion d'une plateforme AIOps peuvent demander un temps et des efforts considérables. La diversité des sources de données disponibles, ainsi que le stockage, la protection et la conservation des données jouent un rôle essentiel dans les résultats de l'AIOps.

Le succès de l'AIOps exige une totale confiance dans les outils, ce qui peut poser des difficultés à certaines entreprises. Pour qu'un outil AIOps agisse en autonomie, il doit suivre avec précision les changements apportés à l'environnement cible, collecter et protéger les données, établir des conclusions correctes à partir des algorithmes disponibles et de l'apprentissage automatique, hiérarchiser correctement les actions et prendre automatiquement les mesures qui s'imposent pour respecter les priorités et les objectifs métier.

Mise en oeuvre de l'AIOps

Pour prouver la valeur du déploiement de l'AIOps et en atténuer les risques, il est recommandé d'introduire la technologie progressivement, à petites doses savamment calculées. Choisissez le modèle d'hébergement approprié pour l'outil : sur site ou à la demande. L'équipe informatique doit comprendre les enjeux, puis former le système en fonction des besoins. Pour cela, elle doit collecter un maximum de données des systèmes dont elle a la charge.

Bien que l'AIOps soit un domaine très nouveau, les entreprises disposent déjà de nombreuses offres de produits à étudier et à évaluer. Citons notamment :

  • l'outil ITSI (IT Service Intelligence) de Splunk ;
  • la plateforme TrueSight de BMC ;
  • Crosswork Situation Manager de Cisco, le composant AIOps de la gamme de produits Cisco Crosswork Network Automation ;
  • Moogsoft AIOps et
  • DRYiCE AIOps de HCL Technologies Ltd.

Des suites de produits existantes se dotent également de fonctions AIOps. Par exemple :

  • New Relic Applied Intelligence (NRAI), qui intègre des fonctionnalités basées sur l'IA (radars et profils d'erreurs) dans la plateforme d'intelligence numérique de New Relic et

la plateforme de déploiement d'applications Trebuchet de Datapipe, qui s'appuie sur l'IA pour optimiser les processus DevOps.

Cette définition a été mise à jour en août 2018

Pour approfondir sur Base de données

Close