IA : le guide des équipements serveur pour votre datacenter
Introduction
Les entreprises doivent s’équiper pour exécuter leurs applications d’IA. Deux options s’offrent à elles. Soit elles souscrivent à des services dédiés chez les hyperscalers américains, avec tout ce que cela comporte d’agilité (c’est simple) et de contraintes (surtout au regard des réglementations). Soit elles achètent des serveurs dotés de GPU pour inférer, surentraîner, voire entraîner tout court des modèles qui sont pour la plupart librement téléchargeables. Cette seconde option présente le mérite de l’indépendance et de l’étanchéité des données.
Mais attention : il n’est pas certain que les entreprises aient le loisir de beaucoup attendre avant d’acheter leurs serveurs. En effet, plusieurs menaces pèsent sur la disponibilité des configurations capables de traiter des algorithmes d’IA. Elles vont de la pénurie des GPU, car les hyperscalers achètent au fur et à mesure l’essentiel des puces que Nvidia et AMD font fabriquer chez TSMC, jusqu’au risque pur et simple que les USA finissent par en interdire la vente en dehors de leur territoire.
Complétant le dossier que LeMagIT a précédemment consacré aux infrastructures d’IA que Dell a présentées lors de son Tech World 2025, ce guide essentiel regroupe tout ce qu’il faut savoir sur les plateformes clés en main, les serveurs de calcul et les puces d’IA qui s’offrent aujourd’hui aux entreprises.
Ce guide revient également sur toutes les causes actuelles qui posent un risque de pénurie sur ces infrastructures critiques.
1Plateformes-
Les fournisseurs préparent des configurations clés en main pour l’IA
HPE : « Pour démocratiser l’IA en entreprise, il faut une plateforme »
Le constructeur améliore son offre d’infrastructure de cloud privé pour en faire une plateforme clés en main dédiée à l’IA. Tous les éléments sont pilotés via une seule console et une seule API. Philippe Rullaud, de HPE France, explique pourquoi. Lire la suite
Lenovo : « l’IA sera surtout utilisée en Edge, pour analyser les images »
Numéro deux des fournisseurs d’équipements x86, le constructeur estime qu’il vendra cette année beaucoup de serveurs Edge, en appui des caméras de vidéosurveillance en magasin ou en usine. Lire la suite
Fujitsu appuie son IA de pointe sur Nutanix
Du fait de ses particularités linguistiques et économiques, le Japon investit beaucoup dans des LLM spécialement adaptés à ses usages. Parmi ceux-ci, l’impérieuse nécessité de fonctionner en vase clos est concrétisée par le système NAI de Nutanix. Lire la suite
2Serveurs-
Les infrastructures de l’IA sont des clusters
GTC2025 : Nvidia améliore déjà ses GPU Blackwell
Alors que les modèles B100 et B200 sortent à peine d’usine, le fabricant dévoile déjà un GPU B300 50 % plus rapide. Un système d’orchestration Dynamo, qui optimise leur fonctionnement, et des versions pour stations de travail sont aussi dévoilés. Lire la suite
IA : Huawei dévoile son cluster de calcul rival de Nvidia
Le CloudMatrix 384 occupe 16 fois plus d’espace au sol et consomme 5 fois plus d’électricité que le DGX B200 NVL72 de Nvidia. Mais il est 70 % plus performant, permet d’entraîner des modèles 3,6 fois plus complexes et se contente d’un refroidissement par air. Lire la suite
Infrastructures : Lenovo sort la boîte à outils pour l’IA faite maison
Lenovo ajoute à ses infrastructures commercialisées à l’usage des configurations à base de GPU Nvidia et le système de refroidissement à eau Neptune. Des outils de monitoring permettent d’en limiter les coûts. Lire la suite
Avec le Z17, IBM colle l’IA aux transactions bancaires
Le dernier-né des mainframes va intégrer des accélérateurs qui permettront d’analyser des opérations en temps réel, sans nécessiter de déport vers un calculateur Nvidia. De plus, nombre d’outils précédemment en cloud sont désormais intégrés, pour plus de sécurité. Lire la suite
IBM commercialise ses serveurs Unix Power11
Bien que plus économes en énergie, les quatre machines présentées rappellent furieusement celles de la génération précédente dans leur format et leurs détails techniques. Elles accepteront bientôt la carte d’accélération d’IA Spyre, déjà présentée sur les mainframes. Lire la suite
3Puces-
Les semiconducteurs qui portent le calcul de l’IA
GTC2025 : « Nvidia recentre sa production sur les GPU haut de gamme »
Malgré un catalogue a priori aussi riche qu’auparavant, les nouveaux GPU Blackwell ne seront d’abord disponibles que sur un nombre très limité de modèles. Le très haut de gamme GB200 pour les hyperscalers et des cartes RTX pour le reste du monde. Lire la suite
Nvidia commercialise son GPU Blackwell pour PME
Le GPU RTX Pro 6000 Blackwell Server Edition permet au tout venant des entreprises de bénéficier dans leur salle informatique, sur des serveurs d’appoint, de la puissance en IA des grands datacenters. Lire la suite
Puces pour l’IA : AMD dévoile son GPU MI350X
Le constructeur prétend lancer la meilleure alternative aux GPU Blackwell de Nvidia. Son GPU MI350X peut charger des LLM de plus grande taille qu’un B200, avec une précision de 6 bits inédite qui autorise de meilleurs compromis en inférence. Lire la suite
Processeurs : Ampere dévoile 256 cœurs et abolit les GPU pour l’inférence
Le fabricant des processeurs ARM pour hyperscalers noue des partenariats pour proposer des serveurs clé en main aux entreprises, annonce une nouvelle version 40 % meilleure que les x86 et fournit des kits pour faire de l’IA générative sans GPU. Lire la suite
Puces IA : dix fournisseurs proposent une alternative à Nvidia
La demande actuelle pour des GPU menace de dépasser les capacités de production de Nvidia. Selon leurs besoins, les entreprises peuvent se tourner vers dix autres fournisseurs. Lire la suite
4Pénurie-
Les dangers qui risquent d’empêcher les Européens de s’équiper
Puces pour l’IA : la production menace de ne pas suivre la demande
Les États occidentaux ont décidé d’investir des milliards pour déployer sur leurs territoires d’immenses quantités de GPU, tandis que les géants d’Internet réservent en avance la majorité de la production de Nvidia. Pendant ce temps, les usines ne fabriquent pas plus. Lire la suite
Taiwan refuse de partager la production de puces d’IA avec les USA
Alors que le gouvernement des USA se targue de négocier avec Taiwan le transfert sur son sol de la moitié de la production des puces de TSMC, la vice-première ministre taiwanaise rétorque qu’elle n’était pas au courant et qu’elle s’oppose même à une telle idée. Lire la suite
Le Sénat américain propose d’interdire la vente de GPU en Europe
Une proposition de loi suggère que le barème TPP, qui empêche les GPU classiques d’entrer en Chine, s’applique à l’ensemble du monde. L’Europe serait dès lors condamnée à utiliser les services des hyperscalers américains pour travailler avec l’IA. Lire la suite
Une nouvelle interdiction américaine menace la production de mémoires
L’administration Trump vient d’abroger l’autorisation précédemment accordée à Samsung et SK Hynix d’importer en Chine des équipements pour fabriquer des NAND et des DRAM. 40 % de leur production mondiale serait remis en cause. Intel et TSMC sont aussi concernés. Lire la suite