Été 2017 : British Airways paye au prix fort les coupes dans son IT

«BA» va perde beaucoup plus que les économies qu'elle comptait faire en économisant sur ses datacenters. Pire, malgré les incidents d'exploitation de cet été, elle continue sa stratégie de pur cost-killer. Un bon contre-exemple, pour les DSI, à présenter lors des négociations budgétaires ?

Annus horribilis pour « British ». La compagnie aérienne britannique a subi deux incidents majeurs d’exploitation cet été. En cause, à chaque fois, une IT défaillante même si l’entreprise tente de faire bonne figure en invoquant des erreurs humaines.

Trois incidents liés à l'IT en moins de 12 mois

Le 27 mai, à la veille d’un week-end prolongé (le Bank Holliday), British Airways a dû affronter une première panne de son système opérationnel (enregistrement, gestion des bagages, réservations, centres de contact). L'interruption a officiellement été provoquée par « une défaillance du système électrique d’un datacenter ». Un problème de prise qui a cloué plus de 70.000 passagers au sol et annulé une centaine de vols.

Il s'agissait de la première panne de l'année civile, mais pas des 12 derniers mois. En septembre 2016, toujours à cause d’un défaut informatique, les agents au sol avait dû émettre eux-mêmes les cartes d’embarquement à la main. Là encore, de nombreux vols avaient dû être annulés.

Retour en 2017. Début août, rebelote. Une IT à nouveau en panne a immobilisé les enregistrements pendant de longues heures, provoquant des queues monstres à Gatwick et à Heathrow. Et, comme les deux fois précédentes, des annulations de vols.

A chaque fois, la compagnie a tenté de minimiser la portée de la panne. « Cela n’a pas duré longtemps », expliquait par exemple en substance Bristish Airways à nos collègues de ComputerWeekly pour l'incident d'août. Même argument en mai. Reste que les conséquences, elles, ne sont pas minimes financièrement et qu'elles affectent directement les clients, et donc l’image de l’entreprise.

Erreur humaine, vraiment ?

Concernant l’incident de mai du Bank Holiday, British Airways a même évacué le problème. « Il ne s’agissait pas d’un souci informatique, c’était un problème humain » (sic) a-t-elle justifié. L’alimentation a été débranchée par un employé. Certes, mais où était le système de secours ? Qui a formé les équipes du datacenter pour ne pas débrancher tel ou tel appareil ? Pourquoi des serveurs critiques pour l’exploitation ont-ils pu être mis hors service aussi facilement ?

Lee Kirby, président du Uptime Institute, un cabinet expert en incidents dans les datacenter, soupire : « depuis plus de 20 ans que je travaille dans le domaine, j’ai remarqué que ‘’l’erreur humaine’’ est une excuse éculée qui cache de mauvaises décisions de management et d’investissements prises au fil des ans »

« Ce qui me chagrine c’est que l’on sait gérer les interruptions de service depuis deux décennies […] avec des datacenter 3 Tiers, des redondances (NDR : et des PCA). On ne devrait plus voir ce genre de problème ».

Contrairement à la version officielle, pour Lee Kirby, les malheurs de Britsh Airways ne sont pas dus au facteur humain mais bien aux « décisions successives de réduction des coûts et d’allocation des budgets qui n’ont pas permis de moderniser les équipements IT ». Dans un contexte financier difficile pour l'aérien (low-costs, compagnies des pays émergeants à faible coûts, etc.), l’investissement dans les locaux IT est souvent sacrifié en premier, regrette-t-il.

« Réduire les redondances et les réplications est ce qu’ils regardent en premier. Mais quand ils font cela, ils se mettent eux-mêmes en danger. Et quand un problème arrive, la première chose qu’ils cherchent est un bouc émissaire : un technicien ou un sous-traitant. Alors que c’est une décision du top management de ne pas changer l’infrastructure ou de ne pas mettre en place des formations pour être 24/7 ».

Externalisation et absence d'investissements IT : un mauvais pari financier

Résultat, beaucoup d'entreprises du secteur mettent à jour l’existant IT par petites touches, pour s’adapter à l’ouverture nécessaire des backend exigée par les clients (mobilité, services web, etc). « Mais il n’y a pas de vision réellement globale parce que repenser tout le système depuis une page blanche, concevoir une architecture multi-site et des back up pour les actifs IT, cela coute très cher ».

Dans un premier temps, les observateurs s’étaient demandé si l’externalisation d’une partie de l’IT à Tata Consultancy Services avait un lien avec les incidents. Le PDG Alex Cruz avait immédiatement balayé l’hypothèse d’un revers de main.

En fait, il y a bien un certain lien. Un lien dans le sens où le management de British Airways cherche à baisser ses coûts IT par tous les moyens sans nécessairement voir qu'au-delà d'un certain seuil d'économies, celles-ci peuvent lui coûter plus cher que ce qu’elles lui rapportent.

Le propriétaire de la compagnie, International Airlines Group, a déjà chiffré la note pour mai : 58 millions de livres sterling. Mais d'autres sources parlent déjà d'une addition de 120 millions (plus de 130 millions d'euros).

« La note pourrait même doubler voire tripler quand on y ajoutera le coût des clients qui vont décider de passer une bonne fois pour toute à la concurrence », prévoit Rowan Jackson, fondateur de Promising Outcomes, une société spécialisée dans la relation client. « Le préjudice sera alors bien supérieur à ce que Bristish Airways espérait récupérer en présurant ses coûts ».

« Ils vont devoir prendre du recul », prédit Chris Brown (CTO du Uptime Institute). « Il va falloir qu’ils déterminent dans quel état sont leurs systèmes et où ils sont hébergés. [Puis] qu’ils aient un plan pour résoudre les problèmes. Cela ne se fera pas du jour au lendemain. Cela prendra du temps et de l’argent ».

Nos collègues de ComputerWeekly (groupe TechTarget, dont fait partie LeMagIT) ont soumis ces remarques à British Airways du Uptime Institute. Réponse ? « Nous savons ce qui s’est passé. Nous enquêtons pour savoir pourquoi cela s’est passé ». Rien à voir avec une IT vieillissante ou à un manque d’investissement donc.

« L'IT est tellement importante que je ne l’externaliserai jamais »... disait l'ancien patron de BA

Ironiquement, dans les années 90, un des dirigeants emblématiques de Birtish Airways, Lord Colin Marshall, avait donné une interview qui résonne étrangement aujourd’hui. « Les pilotes peuvent être malades, la nourriture peut être mauvaise, l’avion peut être en retard, nous pouvons perdre les bagages d’un passager. Je sais comment régler tout cela. Et je le ferai. Mais ce dont j’ai le plus peur, c’est que notre système d’information tombe en panne ».

« Nous sommes dépendant de manière critique de notre personnel IT pour notre survie », constatait Colin Marshall. « Notre IT a une telle importante stratégique que je garde toujours mon DSI près de moi. L'IT est tellement importante que je ne l’externaliserai jamais ».

Cette phrase est rappelée par Rowan Jackson dans un billet à la fois constructif et assassin (intitulé « Un brillant exemple de réduction de coûts qui augmentent les coûts »). Le fondateur de Promising Outcomes, est détenteur de longue date d’une carte de fidélité Gold chez British Airways. En tant que client, il y décrit de l’intérieur les conséquences de cette dégradation du service et de l'IT.

Il constate que vingt ans plus tard, ceux « qui n’ont pas le QI » de Lord Colin Marshall, ont fait tout le contraire. « Depuis l’ère Marshall, l’expérience client s’est continuellement dégradée avec une succession de cost-killers. [...]  Et ce n'est pas que les clients qui en souffrent. Actuellement, 58 membres d'équipages démissionnent chaque mois à Gatwick. Gérer une entreprise uniquement avec des techniques d'optimisation opérationnelle n'a jamais fonctionné et ne fonctionnera jamais. C'est une erreur stratégique majeure ».

Ryanair fait de la com sur son IT totalement interne, BA persiste

De son côté, Ryanair a immédiatement exploité la mauvaise publicité de ces incidents pour souligner que « son IT est entièrement internalisée avec des backups dans trois pays différents ».

Parmi les 10 conseils que Rowan Jackson liste pour remonter la pente, l'expert préconise de s'inspirer de Ryanair. « Réinternalisez tout voter SI, ayez des backups. Ne sous-traitez pas en Inde ou en Espagne. Votre IT est trop importante pour la confier à d'autres »

« Et n'outsourcez pas vos centres d'appels !», exhorte-t-il.  Pour lui, tous ces actifs stratégiques devraient « tourner grâce à des personnels bien payés, que l'on a motivé, et employés par British Airways. Pas par des personnes qui ne connaissent ni la culture d'entreprise ni vos clients ».

British Airways vient de décider exactement le contraire en externalisant ses call centers, affectant un millier de ses employés. « Bristish Airways n'a rien appris des 75.000 passagers qu'il a bloqués au sol. On dirait qu'ils veulent devenir une compagnie en réalité virtuelle », raille le syndicat GMB.

La compagnie justifie cette décision au nom de l'IT, « pour bénéficier des dernières innovations technologiques » (sic). Une nouvelle erreur humaine ?

Pour approfondir sur Continuité d’activité, Sécurité physique

Close