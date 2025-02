Comme tout grand réseau de franchisés, l’essentiel des données de l’enseigne Alain Afflelou provient de ses systèmes de caisses. Les données relatives aux ventes, aux clients et aux produits alimentent un Data Lake central déployé sur Databricks et porté par Microsoft Azure.

Ce lac est aussi nourri de données CRM et PRM (Prospect Relationship Management) en provenance de la plateforme Salesforce. À cela s’ajoutent les informations disponibles depuis la solution analytique Web Piwik, ainsi que des réponses aux questionnaires NPS (Net Promoter Score).

Chief Data Officer chez Alain Afflelou depuis plus de 2 ans, Jean-Christophe Leboucher précise : « Toutes ces sources sont intégrées à un Data Lake sur Microsoft Azure. Nous n’avons pas adopté une architecture en médaillon traditionnelle [N.D.L.R. : avec des zones Bronze/Silver/Gold] ».

Toutefois, le modèle de traitement de données choisi n’est pas très différent d’un médaillon. « [L’architecture inclut] une partie Raw, une partie Trusted et une partie Refined. » La couche Raw collecte l’ensemble des fichiers et les stocke. Ces données sont transformées via Databricks pour atterrir en zone Trusted. Celles-ci sont enfin exposées aux applications dans la couche Refined. Alain Afflelou a fait le choix de Microsoft Power BI pour exposer les données à destination de ses franchisés.

Parmi les cas d’usage principaux, l’on retrouve le suivi de l’activité, la vision à 360° du client, des tableaux de bord d’aide à la décision et le pilotage opérationnel des magasins. Un autre usage important du Data Lake porte sur le ciblage marketing. Les données sont exploitées pour l’activation des prospects et clients ainsi que la notoriété. Enfin, l’équipe data science s’appuie sur quelques outils de la pile technologique Azure et essentiellement sur Databricks pour travailler sur les prévisions de ventes, la segmentation et le « scoring ».

Il manquait une brique de gouvernance pour gérer l’ensemble de ses données. « Mon métier est de faire en sorte que les données soient valorisées dans l’entreprise et correctement utilisées », affirme Jean-Christophe Boucher. « Je dois faire en sorte que les métiers aient l’assurance que les décisions qu’ils prendront à partir de ces données sont les bonnes. »

Le contexte est sensible : tout problème concernant les données peut impacter le chiffre d’affaires d’un franchisé. L’équipe de Jean-Christophe Leboucher n’a pas droit à l’erreur. L’objectif du CDO est d’assurer un suivi depuis les données entrantes jusqu’aux données sortantes. Il s’agit de gérer finement la qualité de données, le « Data Lineage » et, si nécessaire, leur confidentialité. De fait, les opticiens sont amenés à manipuler les données de santé de leurs clients. « Nous voulons maîtriser toutes les données qui sortent du data lake, notamment à destination de Power BI, car c’est notre plus grosse source d’exposition. Les 1 000 magasins doivent pouvoir bénéficier de cette donnée, et cela fait partie de la démocratisation de la donnée que nous souhaitons mettre en place. »

Informatica préférée pour son approche tout-en-un Une dizaine de solutions de gouvernance des données ont été évaluées dans le cadre de ce projet. Le CDO a choisi la solution cloud d’Informatica (IDMC). Il souhaitait que toutes les composantes de sa stratégie de gouvernance soient portées par la même plateforme. « Je ne voulais pas devoir faire beaucoup d’efforts de formation. Avoir un même back-office tout intégré était très important pour moi, que ce soit sur le Data Lineage, les outils de qualité des données et les Data Catalog », justifie-t-il. Un autre point important était de pouvoir s’appuyer sur une équipe localisée en France sur les phases les plus complexes du projet. Enfin, le mode de facturation pratiqué par Informatica convenait bien à Jean-Christophe Leboucher. « C’est assez contre-intuitif, mais le modèle économique de la solution se base sur des IPU (Informatica Processing Unit) que l’on consomme. Les CFO n’aiment généralement pas cette approche, car on ne sait pas a priori combien on va en consommer, mais cela permet de commencer petit puis de grossir progressivement », estime-t-il. Alors que l’équipe amenée à travailler sur Informatica se limite à 2 personnes, devoir acheter un gros package logiciel dès le début du projet et qui permet de tout faire était plus un handicap qu’un atout. Avancer progressivement dans les usages et n’être facturé que de manière proportionnelle était une approche plus adaptée à l’environnement « data » d’Alain Afflelou. Le premier cas d’usage de cette plateforme déployé ? La traçabilité des données. « Cela permet de suivre la donnée d’un bout à l’autre, de la source jusqu’à son utilisation sur Power BI », explique le CDO. « La plateforme nous rend capables de retracer son parcours et toutes les transformations dont elle a été l’objet ». La majorité de ces transformations étant réalisées dans la plateforme Databricks. Jean-Christophe Leboucher met en œuvre les connecteurs entre Databricks et Informatica pour scanner les informations et savoir comment celles-ci ont été restituées dans Power BI. Une deuxième étape a porté sur la qualité de données. « Ce terme regroupe plusieurs types de contrôles : nous vérifions les structures, les volumes, les valeurs, la fraîcheur des données. Ces quatre points sont très importants et sont travaillés de différentes manières sur la plateforme afin de mener des actions efficaces sur la qualité de la donnée », détaille le CDO.