Pannes dans les datacenters : moins fréquentes, mais attention à l’IA
Le dernier rapport de l’Uptime Institute Intelligence se félicite d’une baisse continue des pannes. Mais il redoute que les incidents repartent à la hausse avec la densité des baies de calcul et s’étonne d’une croissance des incidents dus aux cyberattaques.
Les pannes de centres de données sont de moins en moins fréquentes et graves. Leurs causes sont principalement les problèmes d’alimentation électrique et les cyberattaques de type ransomware. Tels sont les enseignements d’une récente étude du cabinet Uptime Institute Intelligence.
Uptime Intelligence a constaté une baisse globale de la fréquence et de la gravité des pannes pour la quatrième année consécutive, les pannes de distribution d’énergie sur site restant la cause la plus fréquente des pannes graves. En l’occurrence, 42 % des personnes interrogées ont cité une défaillance des onduleurs UPS, 36 % ont déclaré avoir souffert d’un problème de commutateur électrique intermédiaire et 28 % ont subi une panne de générateur.
Les problèmes de refroidissement, après les problèmes d’alimentation électrique, sont la cause la plus fréquente des pannes de centres de données, 13 % des personnes interrogées en ayant connu une.
« Ces chiffres sont cohérents avec ceux des années précédentes et soulignent la vulnérabilité des équipements informatiques aux perturbations électriques, même brèves, y compris les baisses de tension, les commutations et les coupures totales de courant », indique le rapport d’Uptime.
La croissance de l’IA menace la stabilité du refroidissement
Les pannes liées au refroidissement sont moins fréquentes que celles causées par des problèmes d’alimentation, mais elles sont tout de même à l’origine d’environ une panne sur huit chaque année. En revanche, les incidents liés au refroidissement risquent de se multiplier dans les années à venir, car l’augmentation de la densité des baies de serveurs peut entraîner des taux de défaillance plus élevés.
« La demande croissante en matière d’intelligence artificielle met à rude épreuve les infrastructures existantes. »
Rapport Uptime Institute Intelligence
Le rapport fait d’ailleurs un parallèle entre l’augmentation de ces pannes et celle des calculs d’IA. Et, de manière indirecte, entre la course effrénée pour déployer des moyens de calculs d’IA et le risque que les réseaux d’énergie ou les équipements électriques ne suivent pas la cadence.
« La demande croissante en matière d’intelligence artificielle met à rude épreuve les infrastructures existantes, notamment en ce qui concerne l’alimentation et le refroidissement. Dans le même temps, les limitations du réseau électrique et les tensions commerciales mondiales introduisent de nouvelles incertitudes dans les chaînes d’approvisionnement et les plans d’expansion », dit ainsi le rapport. « Ensemble, ces pressions pourraient finir par affecter la fiabilité des datacenters. »
« Les opérateurs de centres de données sont confrontés à un nombre croissant de risques externes échappant à leur contrôle, notamment les contraintes du réseau électrique, les conditions météorologiques extrêmes, les défaillances des fournisseurs de réseau et les problèmes de logiciels tiers » précise à ce propos Andy Lawrence, le directeur d’Uptime Institute Intelligence.
Plus de pannes liées aux cyberattaques
L’analyse des pannes d’Uptime comprend également des données sur les incidents qui ont conduit à une annonce publique, principalement parce que le RGPD impose des déclarations officielles en cas de cyberattaque. Le rapport en référence 119, soit le plus grand nombre depuis 2019, année où 165 pannes de datacenters dues à une cyberattaque avaient fait l’objet d’une déclaration publique.
« La hausse des cyberattaques reflète de multiples facteurs : une dépendance accrue à l’égard de l’infrastructure numérique dans tous les secteurs, l’élargissement des surfaces d’attaque en raison d’environnements informatiques hybrides complexes et d’outils de gestion à distance, ainsi que l’escalade des risques liés aux logiciels et aux chaînes d’approvisionnement de tiers », dit le rapport.