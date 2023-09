Note d’évènement – L’édition 2023 de Big Data & AI Paris aura été celle du Data Mesh, de la Data as a Service et, plus largement, de la « démocratisation » des données.

Fini le temps où se posaient principalement les questions d’infrastructure (même si celles-ci ne sont pas totalement évacuées, loin de là). Et celui de l’Intelligence artificielle appliquée et de la culture data réellement populaire est encore à venir.

Les organisations et les grands groupes semblent être dans une période charnière, où le défi majeur est de connaître ses données pour les rendre accessibles et exploitables : quelles infos avons-nous collectées ? Où sont-elles stockées ? Comment les partager, et comment les enrichir avec les retours des métiers ? Autant d’interrogations qui sont revenues dans beaucoup de témoignages au Palais des Congrès.

Le Self Data Service de l’Intérieur Le ministère de l’Intérieur, par la voix de son sous-directeur de l’innovation et de la donnée, Éric Tiquet a expliqué comment il utilisait la data pour assurer la sécurité lors d’événements d’envergure comme la Coupe du Monde de Rugby ou, demain, les Jeux Olympiques de Paris. Au cœur de ce dispositif : une plateforme de Self Data Services, qui permet – en autonomie (relative) – de gérer et d’analyser les données provenant de nombreuses sources pour détecter les menaces potentielles. « Pour vous ce sont des choses assez communes », a lancé le responsable au public, « elles le sont un peu moins pour l’État ». Et pourtant, d’autres témoignages montrent que cette phase critique et stratégique de la démocratisation des données est en cours, aussi, dans le privé.

Le « plan de vol de la stratégie data » d’Air France Believe, acteur majeur de l’industrie musicale française (400 millions de chiffre d’affaires au premier semestre 2023, plus de 1 700 salariés et une entrée en bourse en 2021), a lui partagé son approche de self-service – grâce à un Data Catalog (en l’occurrence celui de Datagalaxy). Dans un autre secteur, la Head of Operations Research, Data Science & Data Strategy d’Air France – KLM, Julie Pozzi a dévoilé la manière dont la compagnie aérienne nationale a conçu son « plan de vol de la stratégie data » (avec Veltys). Le but était de diffuser l’utilisation des données au sein des deux compagnies (Air France, mais aussi KLM) et d’embarquer à bord de ce voyage vers le « data driven » six métiers différents et toutes les fonctions (de la maintenance à l’exploitation, en passant par les data scientists ou les fonctions supports transverses). Chez Air France – KLM, il y a des hôtesses, mais aussi des Data Stewards (pour reprendre une plaisanterie de Julie Pozzi).

Les supermarchés de la donnée Data Mesh, toujours. Carrefour s’est livré lors de la seconde journée à une visite guidée de son « super marché de la donnée » (sic) dans une comparaison étrangement pertinente entre les différentes étapes de la gestion des données et la supply chain d’un grand magasin. Et de la donnée, Carrefour en a, avec le plus grand datalake d’un distributeur européen – 10 milliards de transactions, historisées sur 3 ans. Les 4 principes du Data Mesh. En interne, Carrefour a décidé de démocratiser l’accès de ces données à ses collaborateurs – aussi bien pour la consommer que pour la « mettre en rayon ». Cette initiative – menée et partagée par Sébastien Rozanes, Global Chief Data & Analytics Officer de Carrefour – a permis au distributeur de mettre en place différents accès en fonction des différents métiers. Dans cette comparaison, les données brutes correspondent à des matières premières, le data warehouse est – logiquement – l’entrepôt de dispatche, bien ordonné (avec des paquets de farine par exemple). Ces données sont ensuite « consommables » par des métiers dans un « restaurant de la donnée » où elles ont été transformées par des professionnels (les data scientists). Mais le nombre de places étant limité, les métiers essaient de faire de l’analytique eux-mêmes en allant directement dans le data warehouse. Mais ces non-experts ne savent pas utiliser les outils de l’entrepôt (chariot élévateur, etc.) et risquent même de « casser les rayonnages » (tables de la base). Pour ne pas courir ce risque, Carrefour a donc lancé cet espace de partage, plus accessible : le supermarché. Tout comme dans un magasin, les jeux de données et des indicateurs (KPI) y sont documentés, avec un étiquetage (attributs, règles de calcul, etc.) et avec une traçabilité. Le tout est organisé par grandes familles pour les retrouver (les rayons). Y compris pour les revendre à l’extérieur (fournisseurs, etc.). Les coulisses du supermarché de la donnée chez Carrefour. La problématique est peu ou prou la même chez ManoMano – le Amazon français du bricolage, de la maison, et du jardin. La scale-up (ManoMano a 10 ans) s’est elle aussi lancée dans une approche plus « self-service » de ses données – une approche qui laisse une très grande liberté aux utilisateurs, mais avec un impératif : maîtriser de près les coûts associés du cloud (revers de la médaille de ce genre d’initiative). FinOps, vous avez dit FinOps ? Démocratisation et diffusion, enfin, chez Getlink (Eurotunnel) où Morade El Fahsi, Head of Data du groupe (et membre du comité de gouvernance de la Cité de l’Intelligence Artificielle des Hauts-de-France et du DAMA des Hauts-de-France) a présenté son projet de centralisation des données dans une optique de « Data as a Service » pour améliorer la prise de décision, la gestion financière ou encore la maintenance des infrastructures.