Elnur - stock.adobe.com

Cloud : les pannes deviendront plus fréquentes en 2026

Les entreprises se préparent à de nouvelles perturbations du cloud. Les pannes généralisées de 2025 ne seraient qu’un avant-goût de ce qui nous attend, préviennent les analystes.

Les pannes du cloud en 2025 ont coûté des milliards de pertes aux entreprises et ont ébranlé la confiance de leurs clients. Hélas, tous les signaux semblent indiquer que ce sera encore pire en 2026.

« Ces incidents n’étaient qu’un avant-goût de ce qui nous attend en 2026, car la priorité des hyperscalers n’est plus dans la maintenance des infrastructures classiques. Les budgets qu’ils lui accordaient jadis sont aujourd’hui détournés pour déployer des infrastructures d’IA. De fait, les infrastructures vieillissantes vacillent sous le poids d'une complexité croissante. Nous pensons que cette stratégie aura des répercussions significatives, sous la forme d'au moins deux pannes majeures de plusieurs jours en 2026 », alerte l’analyste Lee Sustar du cabinet Forrester.

Dans une enquête menée par Oxford Economics et intégrée dans le rapport « The Hidden Costs of Downtime » (Les coûts cachés des temps d'arrêt) publié récemment par l’éditeur Splunk, il a été calculé que les temps d'arrêt coûtent 400 milliards de dollars par an aux entreprises du classement Global 2000. Cela équivaut à un coût moyen de 9 000 dollars par minute d'indisponibilité, soit 540 000 dollars par heure. 

Et les effets des temps d'arrêt ne s'arrêtent pas une fois la perturbation terminée. Selon les directeurs financiers interrogés, il faut 75 jours pour que les revenus se rétablissent. À la suite de l'incident, la valeur du cours de l'action chute en moyenne de 2,5 %. Les entreprises doivent également faire face à l'effet négatif sur leur marque et à la perte de confiance des clients. 

L'une des pannes les plus importantes de 2025 a été celle d'AWS, avec plus de 17 millions de signalements sur Downdetector et une durée de plus de 15 heures. Ce point de défaillance unique a entraîné des interruptions de service chez une multitude de grandes marques d’e-commerce ou d’éditeurs en ligne, dont Netflix et Snapchat.

Une panne peut avoir des conséquences désastreuses, comme celle du 19 juillet 2024, lorsqu'une mise à jour défectueuse de CrowdStrike Falcon a provoqué le crash de millions de systèmes Windows dans le monde entier, entraînant le tristement célèbre « écran bleu de la mort ». Environ 8,5 millions de machines Windows ont été touchés, perturbant des secteurs critiques tels que le transport aérien, les soins de santé et les services financiers. Cette panne a coûté environ 5,4 milliards de dollars aux entreprises américaines du classement Fortune 500.

En quête d’une nouvelle stratégie vis-à-vis des fournisseurs de cloud

Le remède pour éviter tant que faire se peut les conséquences des pannes serait peut-être, pour une entreprise, d’arrêter de regrouper toutes ses applications chez les mêmes hyperscalers. C’est la thèse que défend Catalin Voicu, ingénieur chez l’éditeur de sauvegarde en ligne N2W. Il milite pour répartir les services en ligne entre des hyperscalers et des hébergeurs de cloud privés.

« Les entreprises perdent patience vis-à-vis du cloud tout-en-un dont elles sont dépendantes. Elles prennent conscience de la fragilité de l'infrastructure cloud centralisée et de la façon dont un seul problème peut entraîner des pannes multiples », dit-il. Selon lui, les entreprises seraient tombées dans le piège de contrats globaux financièrement avantageux, qui les incitent à mettre tous leurs œufs dans le même panier. Sauf que cela amplifie leur vulnérabilité aux pannes.

« 2026 accélérera la transition vers des clouds régionaux plus petits et des stratégies multicloud », prédit Catalin Voicu.  En répartissant les charges de travail entre plusieurs fournisseurs de cloud, les entreprises peuvent s'assurer qu'aucun point de défaillance unique ne puisse perturber leurs opérations. De plus, les stratégies multicloud s'étendent souvent à différentes régions et différents centres de données, ce qui réduit le risque d'interruption causé par des problèmes localisés, tels que des catastrophes naturelles ou des pannes régionales.

« Certes, les hyperscalers feront de la résistance. Ils s'efforceront de rassurer leurs clients à l'aide de campagnes marketing agressives, de nouvelles garanties de fiabilité et de promesses de contrats de niveau de service (SLA) à toute épreuve », estime l’ingénieur. Mais ces efforts publicitaires pourraient être contrebalancés par des outils d'IA qui rendront les pannes plus prévisibles et offriront l’opportunité de transférer à temps le trafic et les données vers des architectures cloud secondaires.

Pour approfondir sur IaaS