Le cloud OCI achète déjà 130 000 exemplaires du dernier GPU d’AMD

Oracle revendique que son cloud public sera le premier à proposer des services d’IA basés sur le MI355X. Ils seront deux fois moins chers que ceux motorisés par des GPU Nvidia.

Sitôt annoncé, sitôt acheté. Oracle vient de révéler avoir passé commande de 131 072 exemplaires du tout dernier MI355X d’AMD, la version overclockée et refroidie à l’eau du GPU MI350X qu’AMD a dévoilé la semaine dernière.

Ces GPU équiperont les serveurs du cloud public OCI. Oracle se félicite d’ailleurs d’être le premier hyperscaler à proposer des services de supercalcul et d’IA basés sur cette puce. Selon lui, les calculs sur ces nouveaux services devraient être deux fois moins chers que ceux qu’il propose sur la base de GPU Nvidia.

Ce contrat est d’autant plus intéressant pour AMD qu’Oracle lui achète aussi des processeurs Epyc 9005 et des cartes réseau Pollara 400 (400 Gbit/s) pour équiper les serveurs équipés de ces GPUs. Il faut compter huit GPU, deux processeurs et huit cartes réseau par serveur. La flotte qu’OCI déploiera sera ainsi constituée de 16384 machines.

L’un des premiers clients de cette offre serait l’entreprise américaine Seekr qui planche sur un modèle d’IA spécialement entraîné pour décrire le contenu des images satellites.

Dans la foulée, OpenAI a également annoncé qu’il utiliserait les nouveaux GPU d’AMD pour faire tourner les prochaines versions de ChatGPT en cloud. Cela dit, il n’est pas très clair si OpenAI compte déployer lui-même des clusters ou simplement louer de la puissance de calcul chez OCI. Depuis l’année dernière, OpenAI loue dans le cloud Azure des serveurs à base de GPU AMD MI300X pour fournir des services d’inférence sur ChatGPT.

Beau succès, mais maigre victoire face à Nvidia

Malgré ce succès pour AMD, rien ne dit que les fournisseurs de services d’IA soient prêts à abandonner les GPU de son rival Nvidia. Dans le même temps, Oracle vient aussi d’annoncer la mise en route d’une flotte de 131 072 GPU Nvidia B200 dans OCI (16384 machines HGX) qu’il avait commandés en septembre dernier. Ceux-ci sont donc immédiatement utilisables, alors qu’il faudra probablement attendre la fin de l’année pour utiliser des services d’IA sur MI355X chez OCI.

Les services à base de GPU Nvidia resteront a priori plus chers que ceux à base de GPU AMD, mais ils ont le mérite d’être livrés avec la suite Nvidia AI Enterprise qui permet aux entreprises de personnaliser facilement leurs applications d’IA.

Par ailleurs, cette flotte de serveurs OCI sera accessoirement commercialisée en marque blanche par Nvidia lui-même pour son cloud virtuel DGX Cloud Lepton.

Oracle doit également encore acheter 32768 serveurs Nvidia GB200 NVL72 pour équiper le futur datacenter Stargate voulu par l’administration Trump et auquel le constructeur a promis de participer.

Au-delà de la fidélité qu’Oracle témoigne encore à propos de Nvidia, certains analystes soupçonnent les hyperscalers de ne s’équiper en GPU AMD que pour inciter Nvidia à leur fournir plus rapidement ses GPU B200. Grâce à la suite logicielle qui les accompagne, les GPU de Nvidia passent en effet pour être la norme en matière d’intelligence artificielle. Mais les hyperscalers jouent des coudes pour être livrés rapidement, dans un contexte de production insuffisante de la part de Nvidia.

Pour approfondir sur IaaS