Nvidia commercialise son GPU Blackwell pour PME
Le GPU RTX Pro 6000 Blackwell Server Edition permet au tout venant des entreprises de bénéficier dans leur salle informatique, sur des serveurs d’appoint, de la puissance en IA des grands datacenters.
Nvidia a enfin lancé la commercialisation de son dernier GPU Blackwell pour les serveurs destinés aux PME. Grâce à un partenariat avec Cisco, Dell, HPE, Lenovo et Supermicro, ces entreprises auront accès à des serveurs 2U dotés d’une ou deux cartes RTX Pro 6000 Blackwell Server Edition à même d’exécuter des charges de travail telles que l'IA agentique, la génération de contenu, l'analyse de données, le graphisme, la simulation scientifique, ainsi que l'IA industrielle.
Les GPU RTX Pro 6000 se veulent des accélérateurs haut de gamme, mais adaptés aux infrastructures électriques et de refroidissement des salles informatiques d’appoint. Les serveurs qui en sont équipés s’insèrent dans des racks standards et se refroidissent par ventilation classique.
« Les RTX Pro 6000 sont pour Nvidia une manière de démocratiser Blackwell, sa nouvelle génération de GPU », commente Matt Kimball, analyste principal chez Moor Insights & Strategy. Les GPU RTX Pro contiennent les mêmes cœurs Blackwell que ceux que l’on trouve dans les derniers GPU B200 et B300 pour datacenters et promettent des performances similaires. Mais à une échelle moindre : le nombre de cœurs est réduit et la mémoire embarquée n’est pas de type HBM, ce qui permet de réduire fortement le prix de l’accélérateur.
Accessoirement, les RTX Pro sont gravés avec une finesse de 5 nm, contre 3 nm pour les modèles datacenters. Ce détail, qui pénalise assez peu les performances, signifie que les puces ne souffriront pas de pénurie, car elles sont produites dans les usines à haut rendement de TSMC.
Nvidia commercialisait déjà des RTX Pro 6000, mais uniquement pour stations de travail, avec un format et un ventilateur intégré qui n’étaient pas adaptés à l’utilisation dans un serveur rack.
Succéder aux L40S avec une approche bien plus IA
Dans le catalogue de Nvidia, les RTX Pro 6000 Server Edition succèdent aux cartes L40S. Ces dernières étaient basées sur une architecture Ada Lovelace plus vieille de deux générations et embarquaient 48 Go de mémoire GDDR6 avec un débit de 864 Go/s. Les RTX Pro 6000 s’accompagnent de 96 Go de mémoire DDR7 avec un débit de 1,6 To/s.
Les performances en IA sont sans commune mesure. Essentiellement parce que les RTX Pro 6000 sont capables de travailler avec des précisions de 4 ou 8 bits bien mieux adaptées au traitement des tokens que la précision en 32 bits des anciennes L40S, plutôt conçues pour le graphisme et la simulation. Ainsi, on passe d’une puissance de 91,6 TFlops en 32 bits sur l’ancien modèle à 3700 TFlops en 4 bits sur le nouveau. Toutefois, en 32 bits, la puissance du RTX Pro 6000 n’est que de 117 TFlops.
Dernier point de comparaison : une carte L40S consomme 350W, contre 600W pour une RTX Pro 6000.
« Comme le modèle précédent, le GPU RTX Pro 6000 va servir à accélérer des bureaux virtuels, à générer des contenus synthétiques, à exécuter des jumeaux numériques. Mais cette nouvelle génération concrétise la mise en production d’agents d’IA dans les entreprises afin d’accoler une puissance de calcul à toutes les données », argumente Justin Boitano, qui dirige la branche IA d'entreprise chez Nvidia.
Selon lui, l’arrivée des RTX Pro 6000 sur les serveurs des PME abolit le choix cornélien que les utilisateurs devaient faire entre des serveurs sur site limités en IA, car uniquement dotés de processeurs, et des services d’IA en cloud.
Une stratégie que salue Matt Kimball : « le principal concurrent de Nvidia dans le domaine des GPU, AMD, ne propose pas de produit destiné aux serveurs d’appoint que les entreprises, surtout les plus modestes, veulent redéployer. »