Cet article fait partie de notre guide: Les clés pour comprendre l’importance du MLOps

Orange France modernise ses processus grâce à l’IA

Pour moderniser ses pratiques, Orange France pousse une stratégie visant à démocratiser les usages de la donnée. Techniquement, celle-ci passe l’adoption de Google Cloud et de la plateforme de Dataiku.

Orange France, entité responsable des activités grand public du groupe Orange, entend encore et toujours s’imposer face à Bouygues Telecom, Free et SFR. Convaincre les abonnés, les retenir, voilà le nerf de la guerre. Il existe toutefois des moyens pour rester dans cette compétition de manière plus intelligente et, selon Orange, de manière plus responsable.

« Dans son plan stratégique, Engage 2025, Orange a inscrit des ambitions de croissance de son chiffre d’affaires, de son Net Promoter Score (NPS), donc de la satisfaction de ses clients, ainsi que de la baisse de ses coûts, grâce au levier de la donnée et de l’IA », indique Brice Miranda, adjoint Data, IA et Automatisation chez Orange France. « Ici, nous parlons en centaines de millions d’euros ».

Stratégie « Data » : une redirection plutôt qu’une transformation

Dans ce contexte, le programme Accélération Digitale & IA, crée en septembre 2020, a pour objectif de « mettre en œuvre toute la transformation nécessaire à Orange France, concernant la data, l’IA et l’automatisation ».

Évidemment, l’entité ne part pas d’une feuille blanche. « Nous avons réalisé une évaluation notée sur cinq concernant notre maturité data, et pour nous comparer à nos pairs », évoque l’adjoint.

L’évaluation se compose d’une série de questions réparties en quatre thématiques : technologies, enjeux métiers, stratégie et défis. « Nous avons obtenu une note de 2,9 sur 5. Dans un tel contexte, chercher des gains importants, c’est un beau défi ».

À partir de cette analyse, Orange France a fondé sa stratégie sur trois piliers : les cas d’usage, les actifs « best in class », et une gouvernance fédérée. « Nous nous sommes organisés pour aller chercher des idées de cas d’usage, pour être capables de les livrer, car ce sont eux qui permettent d’atteindre les objectifs de l’entité », explique Brice Miranda. « Ensuite, nous avons trois types d’actifs “best in class” : premièrement, il y a les données de qualité, documentées et facilement trouvables. Deuxièmement, nous avons des outils et une plateforme à la pointe. Troisièmement, nous avons des actifs humains : cela rassemble les sujets d’acculturation, de formation, de perfectionnement et de remise à niveau », liste-t-il.

Le troisième pilier, relatif à la gouvernance fédérée, pose également les bases des notions de transformation exigées par l’équipe Data, IA et Automatisation.

Dataiku et Google Cloud, deux piliers techniques importants pour Orange France

Un certain nombre d’outils étaient déjà en place. « Nous avions effectivement un certain nombre d’outils existants, mais les relations avec certains éditeurs étaient complexes à la fois techniquement et commercialement », indique Brice Miranda.

C’est dans ce contexte que le département Data, IA et Automatisation a décidé en 2021 de réaliser une étude consacrée aux outils de data science. « Concernant les briques MLOps et IA, notre choix s’est porté sur Vertex AI de Google Cloud et Dataiku », explique Brice Miranda.

Data Science Studio (DSS), la plateforme de Dataiku, était déjà déployée chez Orange France depuis la fin de l’année 2018, mais « c’était encore un outil parmi d’autres », indique l’adjoint au programme. Toutefois, la plateforme de data science n’avait pas été sélectionnée exactement pour les mêmes raisons.

En 2018, l’un des premiers critères de choix de l’outil concernait sa prise en charge multisource. « Nous avions de très nombreux gisements de données tels Hadoop, Oracle, Teradata, etc. Nous n’avions pas encore adopté une “data platform” d’envergure », relate-t-il.

L’outil avait également séduit parce qu’il rassemble des capacités de gestion de données et de machine learning, pour ses environnements ouverts capables d’accueillir des packages R et Python, ainsi que par son aspect collaboratif.

En 2019, 90 collaborateurs au sein des équipes chargées de la connaissance client utilisaient Dataiku à des fins d’analytiques.

En 2021, Orange France a étendu son déploiement de Dataiku. « En sus des capacités déjà identifiées, l’aspect low-code/no-code a véritablement plu à une partie de nos équipes. Les fonctionnalités MLOps et la feuille de route en elle-même nous ont également convaincus », affirme Brice Miranda.

Mais ce déploiement s’est poursuivi dans le cadre de l’adoption d’une nouvelle plateforme de données. Orange Business Services n’est pas le seul à être concerné par le partenariat dévoilé à la fin du mois de juillet 2020 avec Google Cloud. Orange France s’est rapproché de GCP pour bâtir une plateforme de stockage et analytique cloud de nouvelle génération.

« Notre vision, c’est de migrer l’ensemble des données que nous nous autorisons à migrer sur Google Cloud Platform. Nous travaillons énormément sur BigQuery. L’outil Vertex AI est natif chez GCP, puis nous avons transposé Dataiku sur ce cloud. La compatibilité de DSS avec GCP était une condition sine qua non », note l’adjoint.

En collaboration avec Dataiku, la DSI d’Orange France a déployé l’architecture de référence, composée d’une instance DSS déployée sur Google Compute Engine, de clusters Kubernetes GKE pour exécuter traitements et les transformations de données de manière élastique, et d’un espace de stockage dédié sur GSC.

À la fin de l’année 2022, ce sont 240 utilisateurs qui exploitaient Dataiku chez Orange France au sein des équipes responsables de la relation client, de la connaissance client, de la détection des fraudes ou encore au sein des directions techniques. « Il y a entre cinq et dix départements concernés », estime l’adjoint.

L’IA au cœur des rouages d’un opérateur télécom

Pourtant, l’intégration et la mise à disposition des outils chez Orange France ne sont pas des processus simples.

« Chez Orange, l’intégration de n’importe quel outil est longue, lourde, et complexe », admet Brice Miranda. « Il faut intégrer un système d’authentification, il faut se connecter à nos bases, il y a des ouvertures de flux, des audits de sécurité, etc. ».

Cette croissance s’explique surtout par la multiplication des cas d’usage du machine learning chez l’opérateur télécom, mais également par la modernisation de systèmes existants.

Par exemple, Orange France utilise Dataiku pour gérer un algorithme de Gradient Boosting consacré à la prévision des appels. « Certains services client sont externalisés. Les partenaires des centres d’appels nous demandent des prévisions afin d’avoir le bon nombre de téléconseillers. S’il n’y en a pas assez, le service client est dégradé, car l’on ne peut plus prendre les appels. S’il y a trop de téléconseillers sur un plateau, il y a un problème, ce n’est pas efficient économiquement », développe Brice Miranda.

Historiquement, ces prévisions sont établies à partir d’une liste de règles. Or, ces « règles de type “If This Then That” qui ont fait leurs preuves en matière de performance deviennent de plus en plus difficiles à maîtriser. Il y a une perte d’intérêt croissant pour les administrer », raconte-t-il.

Il a donc été décidé d’utiliser Dataiku pour développer et gérer un algorithme capable d’effectuer ces prévisions d’appels. « Non seulement cela permet de libérer du temps aux équipes, afin qu’elles effectuent d’autres tâches, mais de surcroît nous avons augmenté les performances des prévisions de trois points », se réjouit Brice Miranda.

Pour l’instant, le modèle de machine learning coexiste avec la liste de règles, mais Orange France compte décommissionner l’ancien système au profit du service ML dans le courant de l’année 2023.

Un autre cas d’usage tout aussi crucial pour un opérateur télécom concerne la détection de la fraude. Là encore, Orange France avait déjà un système reposant sur un moteur de règles, notamment pour détecter les tentatives de commandes frauduleuses de terminaux mobiles. « Avec le modèle d’IA développé sur la plateforme de Dataiku, nous avons amélioré les performances du système », déclare l’adjoint. « Ce ne sont pas des faux positifs : nous avons toujours un humain qui vérifie et qui confirme les tentatives de fraude ».

Dans ce cas-là, le moteur de règles et le modèle de machine learning sont voués à coexister.

DSS et Vertex AI : « deux religions » vouées à se compléter

Par ailleurs, les équipes responsables de la satisfaction client commencent à se pencher sur la prévention des frais non désirés. Toujours pour améliorer le NPS, Orange France tente de s’attaquer à « une des plus grandes sources de frustration pour les clients », à savoir le dépassement de forfait. Ici, les équipes utilisent le clustering sur Dataiku pour examiner les différentes variables qui conduisent à faire grimper le prix sur une facture mensuelle (dépassement du volume d’appels ou de données, appels à l’étranger, etc.). Cela pourrait à terme guider les discussions contractuelles avec les clients ou encore conduire à la révision des modalités d’offres spécifiques.

« Nous souhaitons mettre en place une gouvernance fédérée des outils, des actifs et des cas d’usage, certes, mais avec un peu de souplesse ».
Brice MirandaAdjoint Data, IA et Automatisation, Orange France

Tout comme il y a de possibles achoppements entre les capacités des moteurs de règles et les modèles de machine learning, la plateforme de Dataiku et les briques qui composent Vertex AI de GCP rassemblent des fonctionnalités similaires.

« Nous souhaitons mettre en place une gouvernance fédérée des outils, des actifs et des cas d’usage, certes, mais avec un peu de souplesse », indique Brice Miranda. « Nous laissons les équipes utiliser un des deux outils à leur convenance. Nous nous apercevons qu’il y a deux religions : certains utilisateurs adorent Dataiku, d’autres adorent Vertex AI ».

À terme, l’adjoint Data, IA et Automatisation, pressent qu’il y aura une combinaison des deux outils, en fonction des flux de travail.

Une volonté de démocratiser les usages

La possibilité de transmettre des flux, de prolonger des projets commencés par un expert en utilisant les fonctionnalités low-code/no-code fait partie des bénéfices de Dataiku identifiés par Brice Miranda. « Les équipes qui choisissent Dataiku, veulent faciliter la collaboration, la conduite de projet de bout en bout, le MLOps aujourd’hui, et demain le process mining ou encore la mesure des notions d’éthiques ».

En effet, Orange France un est des membres fondateurs du label Positive AI qui prône le développement « d’une IA responsable ».

Actuellement, Dataiku est accessible aux data scientists, aux experts de la donnée en général, et aux data analysts. Dans le cadre de cette « collaboration », l’éditeur a mis à disposition d’Orange France une plateforme d’e-learning en vue de guider la prise en main de la plateforme.

Les équipes Data et IA d’Orange France réfléchissent encore à la manière d’étendre ce dispositif.

Selon Brice Miranda, cela devrait passer par la stratégie de « data democratization » en cours d’élaboration.

« Nous sommes en train d’établir une stratégie axée sur l’accès en libre-service aux outils et aux données : nous voulons faire de la BI-as-a-Service, de l’AI-as-a -Service, de la Data-as-a-Service ».
Brice MirandaAdjoint Data, IA et Automatisation, Orange France

« Nous sommes en train d’établir une stratégie axée sur l’accès en libre-service aux outils et aux données : nous voulons faire de la BI-as-a-Service, de l’AI-as-a-Service, de la Data-as-a-Service. Ce sont des concepts que nous devons décliner concrètement ».

« Je sais que la plateforme de Dataiku fera partie des outils mis à disposition », poursuit-il.

Toutefois, il faut encore trouver le bon équilibre entre l’accès aux outils, leur utilité suivant les cas d’usage, leur coût et le niveau de formation des collaborateurs.

« Tout data scientist qui demande un compte Dataiku peut y avoir accès […], mais les populations de data analysts sont beaucoup plus nombreuses. Nous devons donc évaluer leur capacité à utiliser l’outil, et s’il répond à un véritable besoin ».

Pour l’instant, la plateforme est accessible par les équipes productrices au sein des directions nationales, à savoir les directions des fraudes, RH, ou encore technique de l’opérateur de télécommunication, signale Brice Miranda. « Pour aller jusqu’au bout de la démocratisation, nous devons atteindre les directions opérationnelles : celles qui pilotent les boutiques et les interventions techniques chez Orange. Une part très importante de nos effectifs y est rattachée ».

Uniformiser la gouvernance des données

Si Brice Miranda prend l’exemple de DSS, cette réflexion est générale. De même, Orange France souhaite uniformiser la gouvernance des données en interne.

« Nous avons mis en place une politique stricte d’accès aux données ».
Brice MirandaAdjoint Data, IA et Automatisation, Orange France

« Nous avons mis en place une politique stricte d’accès aux données », avance-t-il. « Si un data scientist a besoin d’accéder à des jeux de données, il faut que cette demande soit conforme à une finalité. Si la demande n’est pas justifiée ou que certains jeux de données ne correspondent pas à la finalité, la demande est refusée ».

Or quand une demande est acceptée, elle l’est généralement en concordance avec un outil. « Par exemple, quelqu’un peut obtenir l’accès à des données sur BigQuery, mais devra refaire la demande s’il veut les transférer sur DSS. Cela peut être frustrant », poursuit-il. « En 2023, nous allons automatiser la propagation des accès pour simplifier la vie des équipes ».

Ce service rendu aux métiers et aux directions est important, selon l’adjoint. « Chez Orange France, imposer l’adoption de pratiques data, en mode top-down, ne fonctionne pas. Il faut que la demande vienne des utilisateurs finaux. Il y a un désir dans les équipes et une appétence, c’est la clé de notre succès », juge-t-il. Mais il faut un accompagnement adapté, qu’il faut prendre le temps d’instaurer, conseille-t-il.

Pour approfondir sur Intelligence Artificielle et Data Science

Close