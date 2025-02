Le déploiement d’infrastructures d’IA non basées sur des GPU Nvidia a commencé. Aux USA, l’opérateur de cloud privé Vultr déploie désormais des infrastructures pour l’entraînement et l’inférence de LLM à base de GPU MI325X d’AMD. En l’état, Vultr propose à ses clients la location de serveurs qui intègrent huit cartes GPU totalisant 2 To de mémoire HBM3e et pouvant, selon lui, traiter les données à la vitesse de 8 x 6 To/s (des Supermicro AS-8126GS-TNMR 8U).

Comparativement, des serveurs similaires à base de huit GPU Nvidia H200 totalisent 1,128 To de mémoire HBM3E pour une vitesse de 8 x 4,8 To/s, et ceux basés sur des Nvidia H100 totalisent 640 Go de mémoire HBM3 pour une vitesse de 8 x 2 To/s. Accessoirement, les configurations à base de GPU AMD devraient coûter entre 25 % et 36 % moins cher que celles à base de GPU Nvidia. Pour un serveur de 8 GPU, Vultr proposait ainsi précédemment un tarif de 17,52 $/heure avec des AMD MI300X et de 23,92 $/heure avec des Nvidia H100.

Jusqu’ici, les GPU MI325X et, précédemment, MI300X d’AMD ne semblaient intéresser que les fabricants de serveurs pour supercalculateurs, dont HPE. Pour autant, le véritable avantage des GPU d’AMD, que ce soit en traitement d’IA comme en supercalcul, semble plus tenir à leur disponibilité qu’à leurs performances ou leur prix.