Definition

Qu'est-ce que l'apprentissage automatique des opérations (MLOps) ?

Les opérations d'apprentissage automatique (MLOps) sont le développement et l'utilisation de modèles d'apprentissage automatique par les équipes d'opérations de développement (DevOps). MLOps ajoute de la discipline au développement et au déploiement des modèles ML, rendant le processus de développement plus fiable et plus productif.

MLOps englobe un ensemble de processus, plutôt qu'un cadre unique, que les développeurs d'apprentissage automatique utilisent pour construire, déployer et surveiller et former en continu leurs modèles. Il est au cœur de l'ingénierie de l'apprentissage automatique, mélangeant l'intelligence artificielle (IA) et les techniques d'apprentissage automatique avec les pratiques DevOps et d'ingénierie des données.

De nombreuses étapes sont nécessaires avant qu'un modèle de ML soit prêt pour la production, et plusieurs acteurs sont impliqués. La philosophie de développement MLOps est pertinente pour les professionnels de l'informatique qui développent des modèles de ML, déploient les modèles et gèrent l'infrastructure qui les prend en charge. La production d'itérations de modèles de ML nécessite la collaboration et les compétences de plusieurs groupes informatiques, tels que les équipes de science des données, les ingénieurs logiciels et les ingénieurs ML.

Le développement de l'apprentissage profond et d'autres modèles de ML est considéré comme expérimental, et les échecs font partie du processus dans les cas d'utilisation du monde réel. La discipline évolue et il est entendu que, parfois, même un modèle de ML réussi peut ne pas fonctionner de la même manière d'un jour à l'autre.

Comment fonctionne le MLOps

MLOps met en œuvre le cycle de vie de l'apprentissage automatique. Il s'agit des étapes qu'un modèle d'apprentissage automatique doit franchir pour être prêt pour la production. Voici les quatre cycles qui composent le cycle de vie de l'apprentissage automatique :

  1. Le cycle des données. Le cycle des données implique la collecte et la préparation des données pour la formation. Tout d'abord, les données brutes sont extraites de sources appropriées, puis des techniques telles que l'ingénierie des caractéristiques sont utilisées pour transformer, manipuler et organiser les données brutes en données étiquetées prêtes pour l'apprentissage du modèle.
  2. Cycle du modèle. C'est au cours de ce cycle que le modèle est formé à l'aide de ces données. Une fois le modèle formé, il est important d'en suivre les versions futures tout au long du cycle de vie. Certains outils, tels que l'outil open source MLflow, peuvent être utilisés pour simplifier cette tâche.
  3. Cycle de développement. Le modèle y est développé, testé et validé afin de pouvoir être déployé dans un environnement de production. Le déploiement peut être automatisé à l'aide de pipelines et de configurations d'intégration continue/de livraison continue (CI/CD) qui réduisent le nombre de tâches manuelles.
  4. Cycle d'exploitation. Le cycle d'exploitation est un processus de surveillance de bout en bout qui garantit que le modèle de production continue de fonctionner et qu'il est entraîné à nouveau pour améliorer les performances au fil du temps. MLOps peut entraîner automatiquement un modèle ML selon un calendrier défini ou lorsqu'il est déclenché par un événement, tel qu'une mesure de performance du modèle tombant en dessous d'un certain seuil.

En résumé, la création d'un modèle d'apprentissage automatique comporte cinq étapes essentielles.

Principales composantes des MLOps

Le processus d'élaboration du modèle MLOps est composé de plusieurs éléments. Ils sont généralement mis en œuvre de manière séquentielle et garantissent la reproductibilité du processus. Les quatre étapes du cycle de vie de MLOps donnent une vue d'ensemble du processus, mais ces cycles peuvent être décomposés en composants plus détaillés :

  • Collecte et analyse des donnĂ©es. Les donnĂ©es utiles doivent ĂŞtre identifiĂ©es et collectĂ©es.
  • PrĂ©paration des donnĂ©es. Les dĂ©veloppeurs nettoient et prĂ©parent les donnĂ©es pour garantir un formatage cohĂ©rent et une bonne lisibilitĂ© avant de les introduire dans le modèle.
  • DĂ©veloppement et formation du modèle. Les donnĂ©es prĂ©parĂ©es sont utilisĂ©es pour former le modèle de ML, qui est testĂ© pour s'assurer qu'il produit les informations, les prĂ©dictions et les autres rĂ©sultats nĂ©cessaires.
  • DĂ©ploiement du modèle. Le modèle est mis en production, ce qui le rend accessible aux utilisateurs après qu'il a Ă©tĂ© dĂ©veloppĂ© et testĂ©.
  • Surveillance du modèle. Les performances du modèle sont contrĂ´lĂ©es pour s'assurer qu'il fonctionne correctement. Tout dĂ©bogage nĂ©cessaire est effectuĂ© Ă  ce stade.
  • Recyclage des modèles. Les modèles ont besoin de nouvelles donnĂ©es pour continuer Ă  produire des informations et des prĂ©visions prĂ©cises et actualisĂ©es. Le recyclage est un processus continu.
  • CI/CD. Cette composante s'applique Ă  l'ensemble du processus, depuis le dĂ©veloppement et les tests jusqu'au dĂ©ploiement et au recyclage. Il automatise et rationalise ces processus.

Pourquoi les MLOps sont-ils nécessaires ?

Les modèles d'apprentissage automatique ne sont pas construits une seule fois et oubliés ; ils nécessitent une formation continue afin de s'améliorer au fil du temps. C'est là que MLOps intervient. Il assure la formation continue et la surveillance constante nécessaires pour garantir le bon fonctionnement des modèles d'apprentissage automatique.

MLOps documente des processus fiables et des stratégies de gouvernance pour prévenir les problèmes, réduire le temps de développement et créer de meilleurs modèles. MLOps utilise des processus reproductibles de la même manière que les entreprises utilisent des flux de travail pour l'organisation et la cohérence. En outre, l'automatisation de MLOps permet de ne pas perdre de temps avec des tâches qui sont répétées à chaque fois que de nouveaux modèles sont construits.


L'apprentissage automatique offre huit avantages aux entreprises.

Quels sont les avantages des MLOps ?

MLOps offre une série d'avantages, dont les suivants :

  • RapiditĂ© et efficacitĂ©. MLOps automatise de nombreuses tâches rĂ©pĂ©titives dans le dĂ©veloppement ML et dans le pipeline ML. Par exemple, l'automatisation des procĂ©dures de prĂ©paration des donnĂ©es initiales rĂ©duit le temps de dĂ©veloppement et diminue les erreurs humaines dans le modèle.
  • ÉvolutivitĂ©. Les modèles de ML doivent souvent ĂŞtre mis Ă  l'Ă©chelle pour gĂ©rer des charges de travail accrues, des ensembles de donnĂ©es plus importants et de nouvelles fonctionnalitĂ©s. Pour assurer l'Ă©volutivitĂ©, MLOps utilise des technologies telles que les logiciels conteneurisĂ©s et les pipelines de donnĂ©es qui peuvent traiter efficacement de grandes quantitĂ©s de donnĂ©es.
  • FiabilitĂ©. Les tests et la validation des modèles de MLOps permettent de rĂ©soudre les problèmes au cours de la phase de dĂ©veloppement, ce qui accroĂ®t la fiabilitĂ© dès le dĂ©part. Les processus opĂ©rationnels garantissent Ă©galement que les modèles sont conformes aux politiques mises en place par l'organisation. Cela rĂ©duit les risques tels que la dĂ©rive des donnĂ©es, dans laquelle la prĂ©cision d'un modèle se dĂ©tĂ©riore au fil du temps parce que les donnĂ©es sur lesquelles il a Ă©tĂ© formĂ© ont changĂ©.

Les défis du MLOps

Les MLOps sont peut-être plus efficaces que les approches traditionnelles, mais ils ne sont pas sans poser de problèmes. Ces défis sont notamment les suivants :

  • La dotation en personnel. Les scientifiques des donnĂ©es chargĂ©s de dĂ©velopper les algorithmes de ML ne sont peut-ĂŞtre pas les plus efficaces pour les dĂ©ployer. Ils ne sont peut-ĂŞtre pas non plus les mieux Ă©quipĂ©s pour expliquer aux dĂ©veloppeurs de logiciels comment utiliser ces algorithmes. Certaines des meilleures Ă©quipes MLOps adoptent l'idĂ©e de la diversitĂ© cognitive - l'inclusion de personnes qui ont des approches diffĂ©rentes de la rĂ©solution de problèmes et offrent des perspectives uniques parce qu'elles pensent diffĂ©remment.
  • CoĂ»ts Ă©levĂ©s. Les MLOps peuvent ĂŞtre coĂ»teux, Ă©tant donnĂ© la nĂ©cessitĂ© de mettre en place une infrastructure qui utilise de nombreux nouveaux outils. Les ressources nĂ©cessaires Ă  l'analyse des donnĂ©es, ainsi qu'Ă  la formation des modèles et des employĂ©s, sont Ă©galement coĂ»teuses. Cela est particulièrement vrai pour les projets de ML Ă  grande Ă©chelle, avec de nombreuses dĂ©pendances et boucles de rĂ©troaction. Il est important pour une organisation intĂ©ressĂ©e par ces projets d'Ă©valuer si MLOps est la meilleure approche.
  • Des processus imparfaits. Bien que les processus MLOps soient conçus pour rĂ©duire les erreurs, certaines d'entre elles se produisent toujours et nĂ©cessitent une intervention humaine.
  • Les cyberattaques. Les acteurs malveillants constituent une menace Ă©tant donnĂ© la grande quantitĂ© de donnĂ©es que les infrastructures MLOps stockent et traitent. La cybersĂ©curitĂ© est nĂ©cessaire pour minimiser le risque de violations et de fuites de donnĂ©es.

Principaux cas d'utilisation des MLOps

À première vue, le MLOps semble être exclusif à l'industrie technologique ; cependant, d'autres industries trouvent de la valeur dans l'utilisation des pratiques MLOps pour améliorer leurs opérations :

  • Finance. La ML permet d'analyser rapidement des millions de points de donnĂ©es. Les sociĂ©tĂ©s de services financiers peuvent ainsi l'utiliser pour analyser de nombreuses transactions et dĂ©tecter rapidement les fraudes, par exemple.
  • Commerce de dĂ©tail et commerce Ă©lectronique. Le commerce de dĂ©tail s'appuie sur les MLOp pour produire des modèles qui analysent les donnĂ©es d'achat des clients et font des prĂ©dictions sur les ventes futures.
  • SantĂ©. Le logiciel MLOps est utilisĂ© pour analyser des ensembles de donnĂ©es sur les maladies des patients afin d'aider les institutions Ă  poser des diagnostics plus Ă©clairĂ©s.
  • Voyages. L'industrie du voyage analyse les donnĂ©es de voyage des clients afin de mieux les cibler avec des publicitĂ©s pour leurs prochains voyages.
  • Logistique. Ce logiciel est utilisĂ© pour analyser les donnĂ©es de performance des diffĂ©rents modes de transport afin de prĂ©voir les dĂ©faillances et les risques. Cette pratique est connue sous le nom de maintenance prĂ©dictive.
  • Fabrication. Les outils MLOps sont utilisĂ©s pour surveiller les Ă©quipements de fabrication et fournir des capacitĂ©s de maintenance prĂ©dictive.
  • PĂ©trole et gaz. Dans l'industrie du pĂ©trole et du gaz, MLOps surveille les Ă©quipements et analyse les donnĂ©es gĂ©ologiques afin d'identifier les zones propices au forage et Ă  l'extraction du pĂ©trole et du gaz naturel.

MLOps vs. DevOps

La similitude la plus évidente entre DevOps et MLOps est l'accent mis sur la rationalisation des processus de conception et de production. Cependant, la différence la plus évidente entre les deux est que DevOps produit les versions les plus récentes des applications logicielles pour les clients aussi rapidement que possible, un objectif clé des fournisseurs de logiciels. MLOps s'attache au contraire à surmonter les défis propres à l'apprentissage automatique pour produire, optimiser et maintenir un modèle.

DevOps implique généralement des équipes de développement qui programment, testent et déploient des applications logicielles en production. MLOps signifie faire la même chose avec les systèmes et les modèles de ML, mais avec une poignée de phases supplémentaires. Celles-ci comprennent l'extraction des données brutes pour l'analyse, la préparation des données, l'entraînement des modèles, l'évaluation des performances des modèles, ainsi que la surveillance et l'entraînement en continu.


Les pratiques DevOps et MLOps ont des buts et des objectifs différents.

Ingénierie MLOps vs. ML

Le terme d'ingénierie ML est parfois utilisé de manière interchangeable avec celui de MLOps, mais il existe des différences essentielles. MLOps englobe tous les processus du cycle de vie d'un modèle de ML, y compris l'agrégation des données avant le développement, la préparation des données, ainsi que l'entretien et le recyclage après le déploiement. L'ingénierie ML, quant à elle, se concentre sur les étapes de développement et de test d'un modèle pour la production, à l'instar de ce que font les ingénieurs en logiciel.

Par exemple, une équipe MLOps désigne des ingénieurs ML pour gérer les étapes de formation, de déploiement et de test du cycle de vie MLOps. Ces professionnels possèdent les mêmes compétences que les développeurs de logiciels classiques. D'autres membres de l'équipe opérationnelle peuvent avoir des compétences en analyse de données et effectuer des tâches de pré développement liées aux données. Une fois les tâches d'ingénierie ML achevées, l'équipe dans son ensemble assure une maintenance continue et s'adapte à l'évolution des besoins de l'utilisateur final, ce qui peut nécessiter un réentraînement du modèle avec de nouvelles données.

Meilleures pratiques pour les MLOps

Les équipes MLOps adhèrent à de nombreuses stratégies utiles. L'ensemble des pratiques suivantes peut aider à mener à bien un projet d'apprentissage automatique et à réduire les risques d'échec :

  • Une interface de programmation d'application (API) d'un service d'IA existant peut simplifier ou accĂ©lĂ©rer les MLOps de diffĂ©rentes manières. Par exemple, les API peuvent ĂŞtre utilisĂ©es pour rĂ©cupĂ©rer des donnĂ©es Ă  partir de sources de donnĂ©es externes et pour tester automatiquement les modèles de ML.
  • Les professionnels du MLOps mènent souvent des processus de dĂ©veloppement de modèles en parallèle, de sorte que, si un modèle Ă©choue, d'autres sont encore en cours.
  • Les modèles prĂ©-entraĂ®nĂ©s sont utilisĂ©s pour dĂ©montrer la validitĂ© du concept.
  • Les algorithmes gĂ©nĂ©ralisĂ©s qui donnent de bons rĂ©sultats sont ensuite formĂ©s Ă  une tâche spĂ©cifique. Par exemple, un algorithme de rĂ©gression logistique peut ĂŞtre entraĂ®nĂ© Ă  prĂ©dire la probabilitĂ© d'Ă©vĂ©nements futurs.
  • Les sources de donnĂ©es accessibles au public sont utilisĂ©es pour combler les lacunes dans les donnĂ©es d'entraĂ®nement des modèles, fournir de nouvelles donnĂ©es et prĂ©venir la dĂ©rive des modèles.

Comment une organisation peut-elle mettre en œuvre les MLOps ?

Il n'existe pas de méthode unique pour acquérir les employés qualifiés, les outils et l'infrastructure nécessaires pour mener à bien une opération MLOps. Cela dit, il existe trois niveaux de mise en œuvre de MLOps qui coïncident avec les besoins d'une organisation :

  • Niveau 0. Ce niveau correspond aux petites entreprises ou aux startups qui n'ont pas besoin de processus MLOps Ă  grande Ă©chelle. Cela implique peu ou pas d'automatisation, et les petites Ă©quipes de dĂ©veloppement gèrent les processus manuellement. Il n'y a pas non plus de CI/CD, de sorte que les modèles dĂ©ployĂ©s sont rarement mis Ă  niveau une fois qu'ils se trouvent dans un environnement de production.
  • Niveau 1. Les organisations qui ont besoin de mĂ©thodes avancĂ©es peuvent mettre en Ĺ“uvre une formation continue et des outils d'automatisation afin que les processus n'aient pas Ă  ĂŞtre exĂ©cutĂ©s manuellement. La plus grande diffĂ©rence entre les niveaux 0 et 1 est que le niveau 1 permet de mettre Ă  jour les modèles pour tenir compte de l'Ă©volution des besoins des utilisateurs finaux et des nouvelles donnĂ©es.
  • Niveau 2. Le niveau 2 est le plus haut niveau d'automatisation des processus MLOps. Il permet aux organisations d'expĂ©rimenter la crĂ©ation d'un plus grand nombre de modèles. Il s'agit d'utiliser des outils de niveau 2 pour mettre en place un pipeline de processus automatisĂ©s qui peuvent ĂŞtre facilement reproduits et mis Ă  l'Ă©chelle.

Il existe quatre types d'approches de formation en ML. L'apprentissage automatique supervisé est le plus courant, mais il existe également l'apprentissage non supervisé, l'apprentissage semi-supervisé et l'apprentissage renforcé. Découvrez les étapes de la formation à l'apprentissage automatique.

Pour approfondir sur IA appliquée, GenAI, IA infusée