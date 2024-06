Le refroidissement des serveurs par liquide n’est plus une technique expérimentale. Depuis ce mois de juin, le fabricant Dell et l’hébergeur de datacenters en colocation Equinix font la démonstration d’une installation qui fonctionne et qui doit permettre aux entreprises de concrétiser leurs traitements en IA.

« Le refroidissement des serveurs par Direct Liquid Cooling permettrait de refroidir des baies de serveurs qui émettraient jusqu’à 120 kW de chaleur, alors que les systèmes de refroidissement classique par ventilation ne peuvent refroidir au maximum que des étagères rack de serveurs qui dissipent 10, 12, voire 15 kW de chaleur », explique Nicolas Roger, directeur avant-ventes chez Equinix (au milieu à droite sur la photo).

« Le refroidissement par air était suffisant pour des serveurs classiques. Mais cela n’est plus adapté aux baies qui sont à présent remplies de serveurs équipés de GPU et qui, telles que configurées actuellement par nos clients, dissipent 30 kW », ajoute-t-il.

L’enjeu de refroidir au-delà de 15 kW

Physiquement, plus les serveurs calculent, plus ils chauffent. Problème, au-delà d’une certaine température – soit 100 °C au niveau des principales puces de calcul, mais plutôt 70 °C au niveau de la machine entière – leurs performances chutent en flèche. Comme ces températures sont atteintes en quelques secondes à peine, il faut maintenir les machines sous ces plafonds en projetant dans leurs entrailles des litres de substance capables d’arracher les calories produites pour les rejeter plus loin.

La substance en question est historiquement de l’air, soufflé par des ventilateurs. L’efficacité de ce système est surtout fonction de la quantité d’air soufflé, de la vitesse à laquelle il est soufflé et de sa température. Les limites physiques et économiques du système découlent de la volonté, vertueuse, de ne pas dépenser plus d’électricité en refroidissement qu’on en dépense déjà pour faire fonctionner les serveurs.

L’équilibre le plus efficace est donc un air qui sort des serveurs à environ 60 °C, qui est refroidi plus loin à 35 °C par un échangeur thermique le plus naturel possible (via une pompe à chaleur en contact avec l’air extérieur du bâtiment, par exemple) et qui est réinjecté dans les serveurs avec des petits ventilateurs en façade, calibrés pour aspirer relativement vite le faible volume d’air disponible devant une baie. C’est ce système qui permet d’atteindre un indice PUE moyen de 1,5, signifiant que l’on a dépensé les deux tiers de l’électricité facturée pour les serveurs et un tiers pour le système de refroidissement.

Mais ce système par air ne peut donc maintenir en opération que des serveurs qui cumulent au grand maximum 15 kW de chaleur par baie. Au-delà, l’air à la sortie des serveurs serait si chaud qu’il faudrait le refroidir avec des climatiseurs et le réinjecter plus vite en plus grosse quantité dans les machines avec des ventilateurs plus puissants. La facture énergétique s’emballerait.

Le Direct Liquid Cooling, ou DLC, est un dispositif qui consiste à faire circuler de l’eau mélangée avec 25 % de propylène glycol à la surface des composants les plus chauds, principalement les CPU et GPU, pour arracher leurs calories. Ce mélange liquide est beaucoup plus efficace que l’aération, dans le sens où la pompe qui l’injecte dans tous les serveurs d’une baie – à la vitesse de 70 litres par minute – ne coûte pas plus cher en électricité que tous les ventilateurs de façade alors qu’elle permet de capturer dix plus de calories.

« Ce qu’il faut retenir, surtout, c’est que ces systèmes de pompes ne consomment que 4 kWh pour refroidir 300 kW, soit actuellement dix baies de serveurs équipés de GPU. L’un dans l’autre, on tombe à un indice PUE de 1,03 » se félicite Rachel Kumcur, superviseuse des installations critiques chez Equinix (à gauche sur la photo), à propos du système de démonstration installé sur le site PA10 de l’hébergeur.