Rolandino - Fotolia

Auchan valorise ses données grâce à une architecture « data centric »

Afin de libérer les données pour ses collaborateurs et mieux valoriser ce patrimoine, Auchan Retail s’est doté d’une architecture « orientée data ». Elle repose sur des référentiels opérationnels et une base NoSQL.

Auchan Retail est une marque historique du secteur de la distribution avec plus de 55 ans d’existence, 644 points de vente en France et 4 000 sous enseigne, dans 17 pays du monde. Mais en matière de systèmes d’information, une longue histoire est aussi synonyme de complexité.

Le poids de l’existant peut en effet freiner les initiatives en matière de transformation numérique et de données. C’est pour y remédier que l’entreprise française a décidé quatre ans plus tôt de faire évoluer son IT. Sa nouvelle architecture doit reposer sur les grands piliers technologiques que sont les API, le cloud, la cybersécurité et la Data.

Des données mutualisées pour les opérations

En matière de données, Auchan Retail disposait ainsi de systèmes orientés analytique, comprenant notamment un entrepôt de données. Ils permettaient à l’entreprise de développer des outils de pilotage. Ce qui est bien, mais pas suffisant, en particulier pour adopter des modes projet agiles.

« Pourquoi se restreindre ? Pourquoi ne pourrions-nous pas adopter les mêmes méthodes pour d’autres types d’applications ? Mais pour cela, il nous fallait faire évoluer nos technologies et être au niveau de service des applications opérationnelles », explique Eric de Wilde, directeur Data Centric de l’enseigne en France.

Cela passait par une transformation des socles de données, plutôt analytiques donc, en des socles opérationnels avec la conception de référentiels de données opérationnels – ou RDO (prix, produits, tickets, sites…). Ces référentiels, qui doivent permettre le développement rapide de nouvelles applications, font office de « points de vérité ».

« C’est véritablement la vitesse de ces projets qui a été notre moteur », insiste l’expert d’Auchan Retail. Auparavant, l’information était disséminée en divers endroits du SI, recopiée au travers de flux batch, dupliquée, etc. Cela n’était pas sans poser des problèmes, notamment de qualité des données.

L’entreprise fait alors trois constats principaux : un virage incontournable vers le cross-canal, nécessitant une mutualisation accrue ; l’ambition d’être data centric comme source de valeur, malgré une très grande richesse en termes de patrimoine Data ; enfin un système principalement orienté batch, pénalisant la réactivité. Si l’activité Web était plus orientée API, il n’en allait pas de même du reste du SI.

Libérer les données via une approche data-as-a-service

Par ailleurs, le distributeur se donnait comme objectif d’adopter plus largement le cloud (privé et public selon les cas d’usage), mais sans remettre en cause les exigences en matière de sécurité. Ces différents aspects constituaient les « fondements d’une architecture data centric ».

La technique n’est cependant pas le seul volet d’un tel chantier.

« Que ce soit l’opérationnel ou l’analytics, l’objectif était de libérer les données au travers d’une approche dite data-as-a-service. »
Hans BootArchitecte IT, Auchan Retail France

Celui-ci nécessite en parallèle de définir les données, leur valeur, mais également leur gouvernance, ainsi que d’améliorer qualité et accessibilité. Ce qui a par ailleurs amené l’entreprise à séparer l’analytique (basée sur un système hybride Teradata/Google Cloud Platform) de l’opérationnel. « Nous avons concentré nos efforts sur les données opérationnelles. Mais que ce soit l’opérationnel ou l’analytics, l’objectif était de libérer les données au travers d’une approche dite data-as-a-service », détaille Hans Boot, architecte IT pour Auchan Retail France.

Mais pour basculer sur une telle approche, un composant majeur faisait défaut : le RDO. Il s’agit d’un point de vérité qui permet à chacun dans l’entreprise de consommer une donnée précise, par exemple la donnée « produit ». Ces objets métier communs à l’ensemble du groupe sont, grâce aux référentiels, accessibles à tous.

Un RDO peut prendre la forme d’une base de données totalement indépendante ou d’un cache d’exposition pour des MDM (Master Data Management), qui ne permettent pas directement l’accessibilité aux données. C’est pour un tel cache qu’a opté l’équipe architecture transverse du groupe.

Pour cela, elle a fait le choix d’une technologie NoSQL de l’éditeur Couchbase. Une décision justifiée par un besoin de mise à disposition d’une forte volumétrie de données, en temps réel, et en haute disponibilité. « La raison principale, c’est que le NoSQL permet de gérer la modélisation à un plus haut niveau d’abstraction. Ainsi, il est possible de concevoir des bases de données plus génériques s’adaptant facilement à nos besoins et à leurs changements », précise l’architecte, acteur décisif de ce choix.

30 référentiels et 3 milliards de documents référencés

Les propriétés de Couchbase répondaient donc aux exigences techniques du distributeur. La grande majorité des RDO réside dans le cloud privé, même si l’entreprise exploite aussi du cloud public. Grâce à des conteneurs (Docker), la DSI s’est cependant assurée que ces systèmes en termes d’infrastructure étaient agnostiques.

Grâce en outre à une démarche DevOps, Auchan a pu industrialiser le processus de déploiement d’un nouvel RDO. Celui-ci peut être mis en production en l’espace de moins d’une semaine. Aujourd’hui, ce sont ainsi plus de 30 référentiels de données opérationnels qui sont à disposition des métiers. Ils référencent plus de 3 milliards de documents.

Précisons que cette architecture Data Centric est encore en construction et en évolution permanente. « Beaucoup de chemin a été fait, et il reste encore beaucoup de RDO et de cas d'usage métier à déployer », précisent les membres de la DSI.

Et la complexité et les obstacles ne sont de plus pas seulement d’ordre technologique. Il a été nécessaire de conduire une véritablement politique de changement, en particulier en ce qui concerne la « propriété » des données. L’existant et l’hétérogénéité du SI constituent aussi une barrière à surmonter. Ce qui a obligé les différentes DSI à rendre les RDO « multi-protocoles », mais également à se transformer elles-mêmes de l’intérieur.

Eric de Wilde parle ainsi de « changement de mindset [N.D.R. : mentalité] » et même de « révolution ». Historiquement, les DSI du groupe étaient « assez silotées », avec pour chacune leurs traitements, leurs domaines ou leurs données et utilisateurs. Place donc à une approche plus collective, les référentiels se destinant aux besoins de l’entreprise étendue.

Une architecture, mais aussi une organisation data centric

« Les métiers perçoivent les référentiels opérationnels comme un moyen d’accélérer leurs projets. Ils règlent une bonne fois pour toutes notre problématique d’accès simplifié à la donnée avec des niveaux de service importants. »
Eric de WildeDirecteur Data Centric, Auchan

Mais le changement ne se décrète pas, rappelle l’expert Data. Il passe aussi par la construction de pôles de compétences et l’instauration d’un haut niveau de confiance. Outre les centres d’expertise, Auchan s’appuie à cette fin sur des facilitateurs, dont une équipe architecture transverse et des « data owners » (responsables de données).

Cette organisation bénéficie plus largement aux projets numériques du groupe. Les RDO participent à cette mutualisation. « Les métiers perçoivent les référentiels opérationnels comme un moyen d’accélérer leurs projets. Ils règlent une bonne fois pour toutes notre problématique d’accès simplifié à la donnée avec des niveaux de service importants », se félicite Eric de Wilde.

L’architecture n’est néanmoins qu’une première étape et un volet qui se double d’une organisation elle aussi « data centric » qui vise à mettre au plus proche du terrain la responsabilité d’alimenter et de consommer les données. La finalité ? Prendre de meilleures décisions. Pour y parvenir, une grande partie des compétences Data sera à terme décentralisée auprès des métiers.

« Nous avions un grand capital de données très concentré. Nous avons travaillé pour créer ces points de vérité et disposer d’un accès facilité. À présent, c’est en forte proximité des utilisateurs que nous allons pouvoir dégager de la valeur », conclut le responsable Data. Ce projet prépare aussi l’étape d’après. Le développement d’usages de l’intelligence artificielle.

Pour approfondir sur MDM - Gouvernance - Qualité

Close