Serveurs : Lenovo lance des modèles AMD pour tous les usages de l’IA

Le constructeur propose une configuration pour centres de calcul, une autre pour faire de l’inférence en succursale et une dernière pour analyser des images sur des lieux d’activités.

Lenovo lance trois nouveaux serveurs : le Think System SR685a V3 destiné aux centres de calcul, le ThinkSystem SD535 V3 qui s’assemble dans un châssis pour constituer une infrastructure hyperconvergée et le ThinkAgile MX455 V3 EPS (Edge Premier Solution), livré préinstallé avec le système Azure Stack pour s’interfacer automatiquement avec le cloud Azure de Microsoft. Point notable : le Think System SR685a V3 est la première machine du marché livrée avec des GPUs MI300X, l’alternative d’AMD aux GPU H100 de Nvidia.

Ces trois machines s’inscrivent dans une stratégie commerciale « AI for all » (l’Intelligence artificielle pour tous) qui consiste à proposer des configurations de calcul pour chaque cas d’usage impliquant de l’IA.

Capable d’embarquer huit GPUs, le Think System SR685a V3 doit servir à entraîner des grands modèles de langage dans un datacenter. Le nœud de calcul ThinkSystem SD535 V3 doté d’un GPU Nvidia L4 a vocation à traiter des requêtes d’inférence depuis les machines virtuelles qu’il déploie en succursale. Enfin, les six GPU Nvidia L4 que supporte le ThinkAgile MX455 V3 EPS doivent permettre d’analyser en temps réel des images de vidéosurveillance.

Une variété d’usages

« Le marché communique beaucoup sur l’apprentissage des modèles, ce qui correspond généralement à des configurations comprenant beaucoup de puissance de calcul, avec de nombreux GPU. Mais sur les sites d’activité, l’apprentissage n’est pas le principal cas d’usage. Il s’agit plutôt de l’inférence, à savoir le fait d’interroger un modèle déjà entraîné pour qu’il génère une analyse ou un contenu », observe Sid Nag, analyste chez Gartner.

« Du point de vue de l’IA, Lenovo dispose d’un portefeuille particulièrement robuste. Ils ont l’une des offres de bout en bout les plus complètes, si ce n’est la plus complète, depuis les équipements à déployer sur le terrain jusqu’au cœur des datacenters », commente l’analyste Steven Dickens du cabinet de conseil Futurum Group.

Steven Dickens se félicite par ailleurs que Lenovo propose des services d’accompagnement spécifiques aux cas d’usage de l’IA. Ils permettent aux entreprises de choisir la configuration matérielle la plus optimale à déployer selon les cas d’usage et assistent les utilisateurs dans le déploiement spécifique de la partie logicielle.

Outre l’IA, Lenovo cible également les cas d’usage des services financiers, comme la détection et la prévention des fraudes, ou encore le courtage automatisé, avec le Think System SR685a V3.

Selon Sid Nag, « si les fournisseurs de cloud disposent de capacités de calcul massives, le traitement de certaines charges de travail d’IA par leurs services en ligne peut s’avérer plus coûteux que l’achat de serveurs d’IA sur site. D’autant qu’il existe désormais des modèles de langage plus petits, qui se contentent de configurations minimales. De fait, l’IA présente une vraie opportunité de relance pour les fabricants de serveurs. »

 « Si les fournisseurs de cloud disposent de capacités de calcul massives, le traitement de certaines charges de travail d’IA par leurs services en ligne peut s’avérer plus coûteux que l’achat de serveurs d’IA sur site. »
Sid NagAnalyste, Gartner

Les caractéristiques

Dans le détail, le ThinkSystem SR685a V3 est une machine 8U dotée de deux processeurs Epyc 9004 d’AMD dotés chacun de 64 cœurs à 3,7 GHz, ou de 48 cœurs à 3,8 GHz. Outre les GPUs MI300X OAM d’AMD (192 Go de RAM HBM3 par GPU), la machine peut aussi être livrée avec huit GPUs Nvidia H100 SXM5 (80 Go de RAM HBM3 par GPU).

Les formats OAM et SXM5 permettent d’enficher les GPUs horizontalement sur un socle dédié. De fait, les huit slots PCIe 5.0 x16 de la machine sont disponibles pour enficher autant de cartes Infiniband NDR 400 Gbit/s capables de transférer les données directement de la baie de stockage aux GPUs, sans passer par le goulet d’étranglement du processeur.

Pour le reste, le ThinkSystem SR685a V3 supporte 24 barrettes DIMM 64 ou 96 Go, soit une RAM embarquée de 1,5 ou 2,25 To, et 16 SSD NVMe MLC de 3,2 To chacun, soit 51,2 To de capacité interne totale. On notera que la vocation de ces SSD très rapides, et plus résistants à l’usure que des modèles QLC, est de servir de cache interne.

Le format du ThinkSystem SD535 V3 permet d’en mettre quatre exemplaires dans un châssis 2U, appelé chez Lenovo ThinkSystem D3. Chaque nœud de calcul supporte un processeur AMD Epyc 9004 qui peut contenir jusqu’à 128 cœurs à 2,25 GHz ou 16 cœurs à 4,1 GHz. On peut l’accompagner de 12 barrettes RDIMMs de 128 Go chacune (soit 1,5 To de RAM par nœud) et de 6 SSDs NVMe QLC de 15,36 To chacun (soit 92,16 To de stockage brut par nœud).

Le seul slot PCIe 5.0 x16 disponible est dédié au GPU, ici un Nvidia L4 embarquant 24 Go de RAM. La carte réseau – qui peut avoir 4 connecteurs 100 Gbit/s Ethernet – s’enfiche sur un connecteur OCP.

Il est notable que le châssis D3 de Lenovo supporte d’embarquer simultanément des nœuds SD535 V3 à base de processeur AMD Epyc ainsi que des SD530 V3, leurs équivalents basés sur des processeurs Intel Xeon, que Lenovo avait lancés précédemment.

Enfin le ThinkAgile MX455 V3 EPS est un serveur 2U comprenant un processeur AMD Epyc 8004 qui peut avoir jusqu’à 64 cœurs à 2 GHz ou 32 cœurs à 2,65 GHz, accompagné de 6 barrettes DIMMs de 96 Go chacune pour atteindre 576 Go de RAM. La machine supporte 8 SSD NVMe de 15,36 To chacun, dont 4 extractibles. Les 6 GPUs possibles peuvent être soit des Nvidia L4 (24 Go de RAM), soit des Nvidia A2 (16 Go de RAM).

La particularité de cette machine est qu’elle est installable dans un boîtier durci qui la protège de conditions extrêmes sur le terrain, que ce soit en termes de climat (humidité, température), comme de sécurité (verrou, blindage).

Pour approfondir sur Mini serveurs, Edge Computing

Close