Guides Essentiels

Les clés pour comprendre l’importance du MLOps

Introduction

« C’est difficile ». Voilà comment le data scientist d’une grande banque résumait la mise en production des modèles de machine learning et de deep learning auprès du MagIT l’année dernière. Non pas que les outils manquent : pléthores de librairies open source et de plateformes ont vu le jour pour préparer les données, entraîner les modèles, les déployer, récupérer les résultats et réentraîner les modèles en cas de dérives. Ces piles technologiques demeurent difficiles à maintenir et à opérer.

Côté pratique, dans la lignée de l’approche DevOps, le MLOps a fait son apparition. Le « MLOps est une culture et une pratique d’ingénierie ML qui vise à unifier le développement (Dev) et les opérations (Ops) des systèmes de ML », résume Google Cloud dans sa documentation.

Mais il y a, semble-t-il, une disparité forte entre les entreprises ayant largement investi dans leur stratégie de traitement de données et les autres, selon le cinquième baromètre des directions data de Quantmetry, une filiale de Capgemini.

« Ces deux dernières années, le déploiement des pratiques MLOps, les investissements dans les infrastructures technologiques et la montée en maturité progressive des organisations et des compétences ont permis l’atteinte d’un seuil optimal pour les entreprises ayant investi dans leur transformation data depuis plusieurs années », avance Quantmetry dans son rapport.

Dans une étude menée au mois d’avril 2023 auprès de 1 684 sondés, les observations de McKinsey confirment cette tendance. À ceci près que le cabinet de conseil considère que même les entreprises les plus avancées n’ont pas encore mis en pratique toutes les capacités du MLOps.

« Les résultats montrent une fois de plus que même les entreprises les plus performantes ne maîtrisent pas les meilleures pratiques en matière d’adoption de l’IA, telles que le MLOps, bien qu’elles soient beaucoup plus susceptibles de le faire que les autres », écrivent les auteurs de McKinsey. « Par exemple, seulement 35 % des répondants des entreprises les plus performantes en matière d’IA déclarent que, dans la mesure du possible, leurs organisations assemblent des composants existants plutôt que de les réinventer, mais cette proportion est bien plus importante que les 19 % de répondants des autres organisations qui font état de cette pratique ».

Au début de l’année dernière, Tecton, un éditeur de solutions de déploiement de ML a interrogé 1 700 professionnels, principalement originaires d’Europe et d’Amérique du Nord. Selon l’étude, 55,3 % des personnes interrogées affirment que leur entreprise a mis en place une équipe centrale chargée du machine learning (64,3 % dans les groupes de plus de 1 000 collaborateurs, 45,3 % dans les organisations de moins de 250 employés).

En moyenne en 2023, la moitié des entreprises avaient six modèles d’IA ou plus en production, tandis que les grands comptes atteignent une médiane de 12 modèles en production. La majorité des cas d’usage sont consacrés aux systèmes de recommandation, à l’analyse des données clients et à la personnalisation de l’expérience client. Environ 80 % des projets ne passeraient pas le stade de la production.

Au moment de déployer de nouveaux modèles, les répondants doivent faire face aux trois défis majeurs de la réunion des bonnes données d’entraînement (41,1 %), de la construction des bons pipelines de déploiement des modèles (37,6 %) et doivent prouver qu’il y a un retour sur investissement (34,3 %). Surtout, la majorité des équipes ML ont besoin entre un et trois mois pour déployer un nouveau système d’IA.

La collaboration entre les équipes de data science et d’ingénierie (26,1 %), le contrôle des coûts d’infrastructure (25,7 %) et l’interaction des outils dans une stack (23,5 %) sont d’autres difficultés importantes.

D’autant que les cinq briques de la pile technique MLOps identifiées par Tecton (registre de modèle, feature store, suivi de modèles, monitoring des données, inférence des modèles) sont très loin d’être toutes déployées dans les entreprises. Seulement 9,5 % des sondés déclaraient en 2023 que leur organisation avait mis à leur disposition toutes ces briques, quand 39,6 % des sondés affirmaient en avoir trois ou plus.

De manière plus générale, MckInsey remarque que les entreprises les plus avancées sont principalement préoccupées par les modèles et les outils, l’accès au talent, ainsi que l’adoption et la montée à l’échelle des projets. Les autres considèrent que le défi est d’établir une stratégie digne de ce nom, de recruter les talents et de traiter les données.

Or « de nombreuses technologies et pratiques MLOps spécialisées peuvent être nécessaires pour adopter certains des cas d’usage les plus transformateurs [tels] que les applications d’IA générative, et ce, de la manière la plus sûre possible », note le cabinet.

« L’irruption soudaine du tsunami IA générative va constituer un “stress test” pour ces organisations data [les plus avancées] dans ces prochains mois », prédisait Quantmetry au début de l’année 2024.

Les autres devront prendre une décision : faut-il se contenter d’utiliser les systèmes d’IA générative infusée dans les applications métiers en mode SaaS, qui sans doute accéléreront les tâches les plus répétitives, ou investir plus largement dans des systèmes spécifiques, adaptés aux enjeux propres de l’entreprise ?

En ce sens, ce guide essentiel revient sur les grands principes du MLOps, les technologies associées, et présente les stratégies IA de trois entreprises : LVMH, Orange et Equidia.

1Conseils-

Bien lancer une approche MLOps

Conseils IT

Comprendre les fondamentaux d’un cadre MLOps

Vous ne savez pas par où commencer lorsqu’il s’agit de normaliser les processus de machine learning de votre entreprise ? Explorez les principaux éléments à prendre en compte pour constituer un cadre MLOps. Lire la suite

Conseils IT

MLOps : pourquoi l’entraînement continu est essentiel

Les entreprises qui mettent en place des stratégies MLOps doivent prendre en considération quand elles doivent appliquer des étapes d’entraînement continu et quand cela n’est pas nécessaire. Lire la suite

Conseils IT

Comment devenir ingénieur MLOps

Découvrez les principales responsabilités et compétences requises pour une carrière dans le domaine du MLOps, qui se concentre sur la gestion des flux de travail tout au long du cycle de vie des modèles de machine learning. Lire la suite

Conseils IT

Comment construire un modèle de Machine Learning en 7 étapes

Il faut de la patience, de la préparation et de la persévérance pour construire un modèle de machine learning viable, fiable et agile qui rationalise les opérations et renforce les métiers. Lire la suite

Conseils IT

MLSecOps : les bonnes pratiques pour sécuriser l’IA

Si le terme apparaît comme une énième déclinaison marketing, le suivi des meilleures pratiques MLSecOps doit permettre aux entreprises de déployer l’IA et le machine learning sans ajouter de problèmes de sécurité irrémédiables, malgré l’inévitable élargissement de la surface d’attaque. Lire la suite

2Vu sur le marché-

Quelques plateformes et outils

Actualités

MLOps : Knime infuse des fonctions CI/CD dans Business Hub

Knime ajoute des fonctions CI/CD au remplaçant de Knime Server, Business Hub. L’objectif ? Rendre opérationnel le déploiement de modèles de machine learning à large échelle. Lire la suite

Actualités

DSS 12 : automatisation et contrôle, les deux priorités de Dataiku

Le 31 mai, Dataiku a annoncé la disponibilité de Dataiku 12 (DSS pour les intimes), la dernière version en date de sa plateforme de data science. S’il explore les capacités des LLM, l’éditeur poursuit surtout ses efforts pour rendre les projets de data science opérationnels et auditables. Lire la suite

Actualités

Data science : le Français Datategy lance sa plateforme en mode SaaS

Dans l’espoir d’attirer les PME vers sa plateforme automatisée de data science, Datategy la décline dans une version SaaS, pour l’heure hébergée sur AWS. Le déploiement d’une version SaaS sur OVHcloud est d’ores et déjà envisagé. Lire la suite

Conseils IT

Tutoriel MLOps : les premiers pas avec Kubeflow

Pour les équipes qui exécutent des flux de travail de machine learning avec Kubernetes, l’utilisation de Kubeflow peut conduire à des déploiements plus rapides et plus fluides. Commencez avec ce guide d’installation. Lire la suite

3Premières implémentations-

Les retours des utilisateurs

Projets IT

Comment LVMH déploie l’IA à l’échelle

Le célèbre groupe de luxe a mis en place une stratégie afin de déployer à large échelle des modèles de machine learning et de deep learning personnalisés sur plusieurs clouds et dans plusieurs régions. Lire la suite

Projets IT

Orange France modernise ses processus grâce à l’IA

Pour moderniser ses pratiques, Orange France pousse une stratégie visant à démocratiser les usages de la donnée. Techniquement, celle-ci passe l’adoption de Google Cloud et de la plateforme de Dataiku. Lire la suite

Projets IT

IA, analytiques : comment Equidia veut redorer le blason des courses hippiques

Afin de moderniser l’image des courses hippiques, Equidia propose une expérience enrichie autour de son flux de streaming. Pour ce faire, l’équipe digitale de la chaîne met à contribution l’IA, l’analytique et les technologies d’AWS. Lire la suite

Close