Les pannes de centres de données sont de moins en moins fréquentes et graves. Leurs causes sont principalement les problèmes d’alimentation électrique et les cyberattaques de type ransomware. Tels sont les enseignements d’une récente étude du cabinet Uptime Institute Intelligence.

Uptime Intelligence a constaté une baisse globale de la fréquence et de la gravité des pannes pour la quatrième année consécutive, les pannes de distribution d’énergie sur site restant la cause la plus fréquente des pannes graves. En l’occurrence, 42 % des personnes interrogées ont cité une défaillance des onduleurs UPS, 36 % ont déclaré avoir souffert d’un problème de commutateur électrique intermédiaire et 28 % ont subi une panne de générateur.

Les problèmes de refroidissement, après les problèmes d’alimentation électrique, sont la cause la plus fréquente des pannes de centres de données, 13 % des personnes interrogées en ayant connu une.

« Ces chiffres sont cohérents avec ceux des années précédentes et soulignent la vulnérabilité des équipements informatiques aux perturbations électriques, même brèves, y compris les baisses de tension, les commutations et les coupures totales de courant », indique le rapport d’Uptime.

La croissance de l’IA menace la stabilité du refroidissement Les pannes liées au refroidissement sont moins fréquentes que celles causées par des problèmes d’alimentation, mais elles sont tout de même à l’origine d’environ une panne sur huit chaque année. En revanche, les incidents liés au refroidissement risquent de se multiplier dans les années à venir, car l’augmentation de la densité des baies de serveurs peut entraîner des taux de défaillance plus élevés. « La demande croissante en matière d’intelligence artificielle met à rude épreuve les infrastructures existantes. » Rapport Uptime Institute Intelligence Le rapport fait d’ailleurs un parallèle entre l’augmentation de ces pannes et celle des calculs d’IA. Et, de manière indirecte, entre la course effrénée pour déployer des moyens de calculs d’IA et le risque que les réseaux d’énergie ou les équipements électriques ne suivent pas la cadence. « La demande croissante en matière d’intelligence artificielle met à rude épreuve les infrastructures existantes, notamment en ce qui concerne l’alimentation et le refroidissement. Dans le même temps, les limitations du réseau électrique et les tensions commerciales mondiales introduisent de nouvelles incertitudes dans les chaînes d’approvisionnement et les plans d’expansion », dit ainsi le rapport. « Ensemble, ces pressions pourraient finir par affecter la fiabilité des datacenters. » « Les opérateurs de centres de données sont confrontés à un nombre croissant de risques externes échappant à leur contrôle, notamment les contraintes du réseau électrique, les conditions météorologiques extrêmes, les défaillances des fournisseurs de réseau et les problèmes de logiciels tiers » précise à ce propos Andy Lawrence, le directeur d’Uptime Institute Intelligence.