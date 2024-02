La marque Interflora, internationalement reconnue, est née en France en 1946 après la création de la Société Française de Transmissions Florales par l’Association des Fleuristes de France et la section française de Fleurop, un groupe né en Allemagne en 1908.

Aujourd’hui, l’enseigne représente un réseau de distribution de fleurs et de cadeaux regroupant près de 45 000 membres dans 145 pays. En France, la marque Interflora France est pilotée par le groupe MyFlower, contrôlé par PAI Partners. Celui-ci s’est étendu en Europe en rachetant d’autres possesseurs de la licence Interflora au Luxembourg, en Espagne, en Italie, au Portugal, au Danemark, et plus récemment, en Roumanie et en Suède. MyFlower compte environ 280 collaborateurs, gère plus de 4 millions de commandes annuelles (hors Suède) et orchestre un réseau incluant 7 000 fleuristes indépendants. MyFlower a également racheté le site cadeaux.com.

« Interflora ne vend pas que des fleurs, nous proposons aussi des plantes, des chocolats, nous avons aussi une gamme de bières au Danemark. La bière de Noël, c’est quelque chose au Danemark », ajoute Vincent Faburel, Head of Data & Backend Products chez Interflora France.

Effet secondaire de cette décentralisation, la majeure partie des données du groupe résidaient dans des silos.

« Les données étaient accessibles pour certaines personnes avec leurs outils, mais elles n’étaient pas consolidées », raconte le responsable. « Quand ils échangeaient des données, des informations, des KPI, les métiers ne pouvaient pas les comparer, parce que rien n’était centralisé et il n’y avait pas de définitions communes ».

Avec les confinements successifs liés au COVID en 2020, Interflora France voit son nombre de commandes en ligne croître drastiquement. L’entreprise prend alors conscience que l’accès aux données et leur mise en qualité sont des enjeux stratégiques.

« Nous n’avions pas forcément le même sens de l’expression taux d’annulation, en Espagne, en France et ailleurs », illustre le Head of Data. « Désormais, nous avons la même définition pour tout le monde ».

À l’aune des processus et de la connaissance des pratiques de l’entreprise, il a été décidé d'exploiter les données comme un moyen d’obtenir « un langage commun », selon les préceptes de l’approche Data Mesh . « Notre objectif, c’est de considérer les données comme des produits », martèle le Head of Data d’Interflora France.

Un POC « avec les moyens du bord »

Dans un premier temps, à partir de septembre 2021, Vincent Faburel a orchestré un POC sur les infrastructures existantes en France. Il s’agissait de consolider les données sur une base de données PostgreSQL accessible par les équipes Data à travers l’outil de gestion de requêtes DBeaver et par les métiers via Power BI. Les processus d’extraction, de chargement et de transformation de données (ETL) et de reverse ETL, sont effectués à l’aide de Pentaho et de scripts Python. Crontab orchestre et programme les différentes tâches.

Dans un même temps, l’équipe Data accompagne quelques métiers volontaires dans plusieurs départements afin de les outiller et de les former à l’exécution de requêtes et la réalisation de rapports BI.

Ce pilote réalisé « avec les moyens du bord » convainc la direction. « La direction m’a demandé de reproduire l’exercice à l’échelle du groupe. Or chaque business unit avait ses propres systèmes, ses propres processus. Dans chaque nouveau pays, l’on recommençait de zéro », se rappelle Vincent Faburel.

En mai 2022, Decideom remporte par ailleurs un appel d’offres visant à assister cette équipe interne dans la mise en place de la nouvelle stratégie.

Avec Decideom, en juillet 2022, l’équipe Data lance un POC d’une durée de trois à quatre mois afin de déterminer les composants d’une plateforme de données modernisée. Après plusieurs tests, Interflora France choisit d’installer une partie de sa « Data Stack » sur Google Cloud, en privilégiant le data warehouse BigQuery comme espace de stockage.

Les pipelines de transformation de données sont revus au vu des exigences de la direction, en prenant en compte que l’équipe Data n’avait pas la bande passante pour développer tous les connecteurs requis pour couvrir l’ensemble des pays dans le giron de MyFlower.

Dans ce deuxième orchestrateur de pipelines de transformation, Pentaho est remplacé par DBT sur Azure pour effectuer les transformations, tandis que les scripts python conteneurisés servent à orchestrer les opérations de reverse ETL dans les applications. Apache Airflow remplace Crontab comme planificateur des jobs. Il fallait trouver le moyen d’accélérer l’accès aux données brutes déversées dans le data warehouse avant d’être transformées et placées dans des data marts connectés à Power BI.