Phenix-IT, ce logiciel qui maintient l’activité du groupe EDF

EDF a fait le choix de se doter d’un Plan de Continuité d’Activité commun à l’ensemble du groupe. Celui-ci doit permettre à l’entreprise et ses filiales de faire face aux crises pouvant affecter ses systèmes informatiques.

Pour une entreprise comme EDF, l’efficacité et la fiabilité d’un Plan de Continuité d’Activité (PCA) a ceci de capital qu’elle concerne aussi le bon fonctionnement du pays. EDF a fait le choix de se doter d’un PCA transverse au groupe. Il concerne tant les entités d’EDF SA que ses filiales. Il couvre le risque de sinistre majeur dans un datacenter du groupe, une attaque cyber, même la crue centennale en région parisienne, c’est-à-dire tous les risques identifiés qui pèsent au quotidien sur le SI d’EDF.

Pour porter ce PCA, l’entreprise a conçu avec une application dédiée à cette tâche, c’est le projet Phenix-IT. « Parmi l’outillage de crise nécessaire à l’ensemble de ces réponses, nous avions besoin d’un outil pour gérer le plan de reprise d’activité en cas de sinistre d’un datacenter » explique Bruno Leyris, responsable PCA du SI et de la gestion de crise IT du groupe EDF. L’objectif de cet applicatif baptisé Phenix-IT est double. D’une part, Phenix-IT est un outil opérationnel qui doit fonctionner en temps réel, dès que le PCA d’un datacenter est activé. D’autre part, au quotidien, le logiciel doit être capable de communiquer et de générer des rapports destinés tant à la présidence du groupe EDF qu’à l’ensemble des métiers.

Le responsable d’EDF souligne le rôle pris par l’applicatif dans le cadre de l’amélioration et des tests réalisés sur le PCA : « Nous utilisons Phenix-IT régulièrement lors de nos exercices annuels. Chaque année, nous simulons la destruction de nos datacenters et nous suivons la reprise d’activité au travers de Phenix-IT. Dans le cadre de ces exercices, nous générons des reporting, des graphiques d’avancement, nous communiquons au travers des outils sécurisés dans toute l’organisation de crise du groupe EDF» Outre ce rôle opérationnel lors de la gestion de crise IT, Phenix-IT permet de collecter l’ensemble des données relatives à chaque exercice. L’analyse de ces informations contribue à l’amélioration continue de la gestion de crise et du plan de reprise d’activité d’EDF.

Une application de plus en plus riche et sophistiquée

Depuis son lancement il y a une dizaine d’années, Phenix-IT a beaucoup évolué et de nombreuses fonctionnalités développées conjointement avec l’éditeur Mega sont venues se greffer à l’application originale. Parmi les plus grosses évolutions qui ont émaillé la vie de Phenix-IT figure la mise en place de workflows entre les acteurs de crise et d’outils de communication sécurisés qui alertent les membres de la cellule de crise. Ces outils permettent d’échanger pour prendre des décisions plus efficaces. Ils doivent être accessibles à tous les intervenants en 24/7. Leur sécurisation est essentielle dans le sens où la cause d’une crise peut être cyber, avec des attaquants susceptibles d’écouter les communications.

Le volet reporting de Phenix-IT a beaucoup été développé ces dernières années. Tout au long de la crise, le logiciel délivre des graphiques d’avancement par rapport au prévisionnel.  Le logiciel a aussi intégré des fonctions de simulations d’impact qui permettent aux équipes informatiques de tester la résilience des SI au travers des mécanismes de Phenix-IT.

Outre le rôle-clé joué par l’applicatif lors des simulations de crise, Phenix-IT est désormais un logiciel utilisé par la DSI au quotidien ; il est devenu un référentiel du groupe EDF. « Au-delà de sa fonctionnalité PRA, de simulation d’impact et de communication sécurisée en cas de crise, Phenix-IT est devenu le référentiel des SI vitaux. Il est accessible par les responsables de la sécurité de façon à recueillir un certain nombre d’informations et, bien entendu, tester la résilience du SI en temps de paix » ajoute Bruno Leyris.

Un logiciel récemment modernisé sur Mega Hopex

Développé sur une version désormais obsolète de la plateforme Mega, Phenix-IT devenait de plus en plus lourd et coûteux à maintenir. Un projet de rénovation de l’outil a récemment été lancé. Après analyse, il a été décidé de continuer à s’appuyer sur la solution Mega, mais de migrer les développements sur la première version d’Hopex, la plateforme Mega dédiée à la gestion de la gouvernance, du risque, et de la conformité.

« Cette solution nous a ouvert de nouvelles possibilités tout en assurant une continuité dans notre démarche. De ce fait, nous sommes revenus à des standards depuis lesquels nous avions divergé » argumente le responsable.

La DSI d’EDF a progressivement mis en place un mode de fonctionnement agile avec Mega. Les chefs de projet EDF, les développeurs et les commerciaux de l’éditeur se sont succédé au fil du temps au chevet du logiciel. « Phenix-IT en est aujourd’hui à sa neuvième année d’évolution. Beaucoup de personnes ont participé au projet, mais ils ont toujours pris soin de bien comprendre les objectifs et la plus-value qu’EDF attendait de cet outil, tant en temps de paix qu’en temps de crise », assure Bruno Leyris.

« En temps de paix, nous utilisons Phenix-IT tous les jours de façon à lancer des simulations, pour accéder à l’outil de cartographie. La pérennisation et le recouvrement des équipes au fil du temps se sont toujours bien passés », ajoute-t-il.

L’équipe projet produit désormais 2 versions majeures par an, mais ces évolutions sont fortement contraintes en termes de délais. Chaque version majeure doit avoir été recettée avant chaque exercice.

« Tous les 6 mois nous avons une version majeure de Phenix-IT pour assurer l’exercice de notre PRA. C’est une contrainte en matière de délai et de qualité, puisque cela ferait assez désordre que Phenix-IT se crashe pendant l’exercice », commente le responsable.

L’organisation agile permet à Phenix-IT de bénéficier d’améliorations délivrées en continu. Au-delà des périodes d’exercice, les acteurs de la gestion de crise au sein d’EDF se connectent de plus en plus sur l’outil en temps de paix afin de se livrer à des analyses, aussi bien dans la filière IT que dans les filières métiers. De facto, au-delà de son importance en temps de crise, lors du déclenchement du PCA, l’outil est de plus en plus intégré aux processus internes et il est de plus en plus incontournable au quotidien.

Surveiller un nombre d’objets qui croît de 10% par an

Autre enjeu auquel doit faire face l’outil, la croissance inexorable du Plan de continuité DSI, avec un nombre d’objets suivis qui croît de 10% par an. Phenix-IT doit suivre le rythme et intégrer de plus en plus de données issues de nouvelles sources, ce qui implique de travailler sur la qualité des donnes ingérées par Hopex. En outre cette montée en charge tant sur les volumes de données que sur les nouvelles fonctionnalités implique d’accompagner cette croissance sur le plan de la puissance et de la disponibilité de sa plateforme.

Fonctionnellement, EDF souhaite encore faire évoluer sa solution, l’idée principale étant d’intégrer de plus en plus Phenix-IT aux processus de gestion de crise. « Nous souhaitons travailler davantage sur l’ergonomie afin de rendre l’outil un peu plus intuitif : Une personne réveillée en pleine nuit en cas de crise doit disposer d’un outil très intuitif » explique Bruno Leyris. D’autre part, Phenix-IT doit encore être amélioré pour faciliter le travail de l’équipe PCA en cas d’attaque par cryptolocker.

Actuellement Phenix-IT est porté par la solution Hopex v3. L’équipe projet étudie désormais une possible migration vers Hopex v5 et mettre en œuvre certaines des nouvelles fonctionnalités offertes par cette nouvelle version. Une future évolution qui est en cours d’évaluation par la DSI du groupe EDF.

Pour approfondir sur PRA, Reprise après incident

Close