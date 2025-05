Dans un contexte où la production de GPU ne semble pas parvenir à suivre la demande, Nvidia, le principal fabricant de ces puces, lance un service en ligne qui permet d’agglomérer les GPU de différents hyperscalers en un seul pool logique. Appelé DGX Cloud Lepton, ce service est une extension du cloud virtuel DGX Cloud qui consistait déjà à louer chez Nvidia des ressources GPU physiquement présentes chez les hyperscalers.

Lancé en 2023, DGX Cloud se veut une version en ligne des clusters de calcul DGX de Nvidia. Pour autant, Nvidia n’est pas lui-même un hébergeur de serveurs. Cette version virtuelle est donc plus exactement constituée de clusters DGX physiquement installés dans les datacenters d’AWS, Azure, GCP et OCI. Jusque-là, ces clusters étaient chacun des pools de calcul autonomes, dont la puissance pouvait être commercialisée à la découpe soit au travers de DGX Cloud, soit via les offres de serveurs d’IA virtuels des hyperscalers.

De fait, la possibilité existait jusque-là qu’aucun pool de services DGX en ligne n’offre la puissance de calcul requise pour le projet d’une entreprise cliente à un instant T. L’offre DGX Cloud Lepton est censée résoudre ce problème, puisqu’elle permet à chaque cluster DGX d’augmenter dynamiquement sa puissance en allant chercher des ressources de calcul disponibles dans un autre cluster DGX.