En marge des annonces de Nvidia lui-même, le salon GTC 2024 qui se tient cette semaine à San José, dans la Silicon Valley, fait la part belle aux fournisseurs de baies de stockage. Occupant les plus grands stands de l’exposition, tous sont venus présenter une version nouvelle ou spécialement améliorée de leurs solutions pour répondre aux besoins spécifiques des différents calculateurs de Nvidia.

Parmi eux, Dell dévoilait sur son stand sa nouvelle baie PowerScale F710. Il s’agit en l’occurrence d’un serveur Dell PowerEdge 660 – format 1U, deux processeurs Xeon 24 cœurs à 2,6 GHz, RAM de 512 Go, dix SSDs NVMe de 30 To chacun et deux ports Ethernet 100 Gbit/s – fonctionnant sous le système OneFS 9.7.

Utiliser Ethernet plutôt qu’Infiniband « Cette baie de stockage est la première à être validée par Nvidia pour être utilisée en Ethernet sur ses baies de calcul SuperPOD. Toutes les autres ne le sont que sur une connexion Infiniband. Le réseau Ethernet est présent dans toutes les entreprises, alors qu’Infiniband est réservé aux centres de calcul. Or, aujourd’hui, c’est bien le commun des entreprises qui a vocation à faire analyser ses données par l’IA. Donc nous proposons qui leur permet de le faire sans devoir investir dans une autre infrastructure réseau », argumente Tom Wilson, Directeur Produits chez Dell (en photo). En l’occurrence, une baie PowerScale F710 s’interface avec un serveur DGX de Nvidia – ou HGX, quand il s’agit d’un serveur à la configuration similaire, à base de cartes GPU H100, H200 et, bientôt, B100/B200, mais assemblé sous une autre marque. Dell dispose lui-même d’une telle configuration serveur à son catalogue, le PowerEdge XE9680. Pour servir de stockage à tout un SuperPOD pouvant contenir 32 serveurs DGX/HGX, Dell propose d’assembler plusieurs nœuds de stockage PowerScale F710 derrière une batterie de switches Ethernet 100 Gbit/s. Dans cette configuration, les nœuds de calcul DGX sont capables d’ingérer les données issues de la baie de stockage directement dans la mémoire des GPUs H100, via le dispositif GPU Direct. Celui-ci évite l’étape intermédiaire d’un chargement des données dans la RAM du processeur x86 présent sur les serveurs DGX pour un déchargement ensuite dans la RAM des GPUs. Parmi les autres constructeurs ayant évoqué une approche similaire, Cisco a annoncé lors de son dernier évènement Cisco Live d’Amsterdam une configuration également basée sur un réseau Ethernet. Pour autant, celle-ci n’est pas encore disponible.