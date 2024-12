Les fournisseurs d’énergie doivent faire face à une demande croissante. Depuis 2020, celle-ci aurait augmenté de plus de 60 %. Outre le réveil économique des pays émergents et en développements, une technologie très populaire s’avère particulièrement gourmande. L’IA est promise à consommer 5 % de l’énergie produite en Europe, et 4 % dans le monde entier en 2030. Dans un même temps, trois quarts de l’empreinte carbone planétaire proviendrait de la consommation d’énergie, majoritairement des sources fossiles.

Parmi ces fournisseurs, Engie a pris l’engagement d’atteindre le statut d’entreprise Net Zero Carbon en 2045. Quelques éléments le mettent en bonne voie. Engie a déjà pris la tête de la vente de contrats PPA, ceux-là même achetés par les fournisseurs de cloud afin de justifier leur bilan carbone verdissant. En France, le groupe se présente comme le premier fournisseur d’énergies solaires et éoliennes. « 80 % de nos investissements vont dans les énergies renouvelables », assure Biljana Kaitovic, directrice générale du numérique et de l’IT chez Engie, lors du Data & AI World Tour Paris, le 20 novembre. « À la première moitié de l’année 2024, 52 % de l’électricité consommée en Union européenne provenait de sources d’énergie renouvelable ». Mais cela ne fait pas tout.

« Nous croyons que les données, l’IA et le numérique sont des leviers importants pour nous aider à relever ces défis », déclare-t-elle. « Nous l’appliquons à l’excellence opérationnelle, la recherche de nouveaux modèles économiques, l’expérience client et l’expérience employés, etc. ».

Uniformiser l’accès à un patrimoine de données disparates

Or, l’autre défi, c’est qu’une partie des 3 800 membres internes de la DSI d’Engie doit gérer de nombreux systèmes d’information, parfois vieillissants. « Engie est une entreprise complexe et nous avons un très fort héritage. Imaginez, nous étions là à la construction du canal de Suez il y a 150 ans », poursuit-elle.

Aussi, Engie est présent dans 31 pays, contre 70 auparavant. En conséquence, la multiplicité des sources de données bloquait certains projets d’analyse de données et de data science au service des 97 300 collaborateurs du groupe.

De fait, à travers ses activités autour des énergies renouvelables, thermiques, ses fermes de batteries, la gestion de réseaux électriques et d’énergies, la mobilité électrique, et ses solutions pour les clients BtoC et BtoB, Engie dispose plusieurs pétaoctets de données. « Autant d’activités nécessitent beaucoup de processus gérés à travers un portfolio applicatif large et varié », explique Biljana Kaitovic. « Nous avons différents responsables de données par activité et par pays. […] Nous devons servir les besoins variés des métiers dans les différents pays et les différentes unités ».

La variété des données est également un sujet de taille. Les données des installations, des clients, les éléments comptables, achats, RH ont longtemps été gérés à partir de systèmes distincts, parfois développés à façon. Selon, la directrice du numérique, l’intégration entre les systèmes était plutôt limitée. Il faut ajouter à cela la multiplicité des sources de données tierces, notamment pour récupérer les informations du marché et météorologiques.

L’entreprise a débuté de longue date la migration de certains actifs IT vers le cloud. « Notre dépôt principal se nomme “Common Data Hub” ou CDH. Il s’agit d’un lac de données hébergé sur le cloud Azure. Il contient plus de 3 pétaoctets de données, mais ce n’est pas le seul », précise la directrice du numérique chez Engie.

Différentes plateformes ont été bâties sur Azure et AWS (Amazon S3, Kinesis, MongoDB, PostgreSQL, etc.), et d’autres clouds.

« Nous avons encore des systèmes on premise et nous aurons à les conserver pour répondre aux besoins des activités et aux nécessités réglementaires. » Biljana KaitovicDirectrice générale du numérique et de l’IT, Engie

Cependant, les réglementations appliquées dans certains pays et à certaines activités ne lui permettent pas de migrer l’entièreté de ses données.

« Nous avons encore des systèmes on premise et nous aurons à les conserver pour répondre aux besoins des activités et aux nécessités réglementaires. Par exemple, nous gérons une activité nucléaire en Belgique », avance-t-elle.

Afin d’accéder aux données de l’ensemble des systèmes présentés plus haut, Engie a donc fait le choix d’une architecture lakehouse distribuée.

« Notre architecture Lakehouse s’étale sur plusieurs clouds, représente les données en provenance de plusieurs systèmes, de bases de données et permet à nos collaborateurs d’accéder à différents outils analytiques sans la nécessité de répliquer les données ou la pile technologique », affirme Biljana Kaitovic.

Celle-ci peut s’intégrer aux SI de l’entreprise, dont l’ERP SAP, le CRM Salesforce ou les solutions Aveva. Cela permettrait « de former un seul écosystème ». « Cette approche en écosystème est importante, car les données que nous utilisons en provenance de plusieurs sources ont besoin d’être mises en contexte et cela demande souvent de briser les silos ».

Ce lakehouse transverse s’appuie sur Databricks et propulse déjà plusieurs cas d’usage. Le groupe a d’abord choisi cette plateforme pour sa capacité à gérer des flux de données en mode ETL/ELT (via Apache Spark) – des intégrations qui devenaient coûteuses avec les précédents outils – et pour rationaliser la production de tableaux de bord sur Power BI, entre autres.

Entre 2021 et 2022, des solutions concurrentes n’offraient pas forcément directement cette gestion des flux d’intégration ni les mêmes capacités en matière de déploiements d’algorithmes.

Il y avait directement l’intention de suivre la feuille de route de l’éditeur. L’objectif : éviter de produire des applications spécifiques à la durée de vie éphémère. En 2022, Engie rapportait avoir réduit de 10 à six semaines le temps de production de ces tableaux de bord, et a observé un gain d’optimisation de 27 % de ces flux de données – en sus d’avoir diminué le coût d’exploitation de nouvelles instances de gestion de données.

Depuis, il y a eu de nouveaux usages, dont le traitement des données en provenance des installations productrices d’énergie renouvelable. « À la mi-2024, nous avions les installations pour produire 42 gigawatts d’énergies renouvelables, l’équivalent de 15 % de la consommation de la France ».

Une plateforme « d’hypervision » a été développée sur Azure pour intégrer et analyser plus de 180 To de données et plus de 2 000 milliards de points de données. Ces données proviennent de différentes sources, dont le Data Hub, mais aussi d’équipements installés par des fournisseurs sur plusieurs centaines de sites dans le monde, d’autres sont issues de systèmes opérationnels ou encore des plateformes météorologiques tiers.