canjoena - stock.adobe.com

Canicule : les datacenters anglais d’Oracle et Google disjonctent

Les régions londoniennes des clouds publics OCI et GCP étaient partiellement hors service le 19 juillet. Les systèmes de climatisation de leurs datacenters ont succombé face à une température extérieure de plus de 40 °C.

La chaleur record qui a sévi en Europe cette semaine a provoqué des difficultés techniques dans les datacenters britanniques de Google et d’Oracle le mardi 19 juillet. Le jour même où le Royaume-Uni a enregistré la journée la plus chaude de tous les temps, deux des plus grands acteurs du marché du cloud ont rencontré des problèmes de refroidissement dans leurs centres de données.

La région Europe-West2 de Google, basée à Londres, a connu une panne liée au refroidissement qui a commencé à 19 heures – heure de Paris – le 19 juillet, et a été résolue à 5 heures du matin le lendemain. À ce moment-là, la capitale britannique était écrasée par une température de plus de 40 °C.

« Il y a eu une panne liée au refroidissement dans l’un de nos bâtiments qui héberge une partie de la capacité de la zone Europe-West2-a. Elle est maintenant résolue », indique la page qui liste l’état de fonctionnement des services.

L’incident aurait affecté « quelques » clients de GCP, le cloud public de Google, poursuit la page d’état des services. Ils auraient connu des « interruptions anormales des machines virtuelles. » Pendant la panne, il a été conseillé aux utilisateurs de contourner ce problème en relançant leurs applications dans d’autres régions européennes.

Éteindre pour limiter la catastrophe

Simultanément, l’infrastructure de refroidissement du centre de données Oracle UK South, situé à Londres, a également été affectée par les températures élevées. OCI, le cloud public d’Oracle, a été obligé de mettre hors tension une partie de son infrastructure, afin de se protéger contre des défaillances matérielles en cascade, dit sa page d’état.

« Cette mesure a été prise dans l’intention de limiter le potentiel d’un impact à long terme pour nos clients », est-il écrit. Il est précisé que, pendant la panne, les clients d’OCI n’ont pas pu accéder ni utiliser les ressources hébergées dans cette région.

Selon Oracle, des « températures hors-norme pour la saison » sont la cause de ses problèmes. Ceux-ci ont commencé juste après 14 heures mardi, heure de Paris, et ont été résolus à 5 heures du matin le lendemain.

Computer Weekly, le média partenaire du MagIT au Royaume-Uni, a contacté Oracle et Google pour obtenir des commentaires sur cette histoire. Les deux fournisseurs ont déclaré qu’ils n’avaient rien de plus à ajouter pour le moment.

Des perturbations appelées à se répéter

La période de chaleur extrême observée en Europe cette semaine est, selon tous les observateurs, liée à l’arrivée du changement climatique. Le groupe de réflexion sur la résilience des centres de données, l’Uptime Institute, avait alerté depuis des années les opérateurs de centres de données qu’ils encouraient de nouveaux risques de panne liés à ce phénomène.

Sur ce point, l’institut a publié en 2018 une étude alarmante sur le manque de prise en compte des risques que le changement climatique pose sur les datacenters. Selon cette étude, peu d’hébergeurs se sentiraient concernés.

Adam Bradshaw, directeur commercial chez ServerChoice, un prestataire de datacenters en colocation basé à Stevenage, au Royaume-Uni, se dit sidéré par la situation : « Même si les datacenters sont construits pour résister à toutes sortes de circonstances, leurs systèmes de refroidissement, dont dépendent les serveurs pour fonctionner, ont été poussés à leur capacité maximale en raison des températures record que nous avons connues. Les pannes de Google et d’Oracle dues à une canicule montrent que même les plus grands fournisseurs de centres de données peuvent être victimes de conditions météorologiques extrêmes. »

Le problème de la consommation d’énergie

Pire : comme le secteur souffre déjà de la hausse des prix de l’énergie, le coût supplémentaire pour garder les installations au frais pendant les canicules menace d’être trop lourd à supporter pour certains.

« L’énergie est ce qui coûte le plus cher dans un datacenter. La hausse du prix de l’énergie a été un énorme défi pour de nombreux acteurs, obligeant même certains à se mettre en redressement judiciaire. Les coûts supplémentaires causés par la canicule et la probabilité que ces températures se reproduisent dans les années à venir soulignent la nécessité d’alléger la pression financière sur les centres de données dès aujourd’hui », plaide-t-il, en appelant le gouvernement britannique à alléger les taxes qui pèsent sur le secteur.

En l’occurrence, plus il faut consommer d’électricité pour refroidir l’informatique, moins un datacenter est écoresponsable et plus son propriétaire est susceptible d’être sanctionné par des taxes.

Au moment même des pannes à Londres, le fournisseur de cloud public français Scaleway se félicitait sur Twitter de maintenir ses salles informatiques modernes à 26 °C, soit 10 degrés en dessous de la température extérieure observée. Et, ce, sans utiliser d’électricité, en projetant juste de fines gouttelettes d’eau.

Pour approfondir sur Architectures de Datacenters