Intel relance ses GPU, mais juste pour l’inférence
Intel présente un design de cluster de calcul pour l’IA similaire aux DGX NVL72 de Nvidia, qui ne permet pas d’entraîner des AI, mais consomme moins d’énergie pour les utiliser. Il est basé sur sa puce Gaudi3.
Intel ne renonce finalement pas à imposer ses GPU dans les serveurs. À l’occasion de l’événement OCP 2025 consacré aux innovations matérielles pour datacenters et qui se tient cette semaine en Californie, le fondeur américain a dévoilé le design d’un cluster de calcul basé sur sa puce Gaudi3, ainsi que le détail de son futur GPU, pour l’heure appelé Crescent Island.
Le cluster d’Intel comprend 32 nœuds de calcul contenant chacun un processeur Xeon 6700, 2 GPU Gaudi3 contenant chacun 128 Go de mémoire HBM2E et une mémoire HBM3 de 64 Go partagée entre les trois composants (Intel parle de HBD, pour High Bandwidth Memory Domain). On note qu’Intel ne propose pas ici de Xeon Max, la version du Xeon qui intègre 64 Go de HBM directement dans sa puce.
Similaire dans son format au cluster de calcul DGX GB200 NVL72 de Nvidia, ce design d’Intel se présente sous la forme de 16 serveurs contenant chacun deux nœuds de calcul. L’ensemble est refroidi par liquide.
Contrairement au DGX de Nvidia, cette machine n’a pas vocation à entraîner des IA. Elle est conçue pour l’inférence, soit l’exécution d’IA préentraînées. Pour un hébergeur de calcul, l’intérêt de ce cluster est que les GPU Gaudi3 consommeraient chacun 600 watts d’énergie sur les travaux d’inférence, alors que les B200 de Nvidia, conçus pour l’entraînement, consomment au moins le double.
Intel avait lancé Gaudi3 en 2024. Jusqu’ici, ses ventes n’avaient jamais vraiment décollé.
Des GPU Intel repositionnés sur la seule inférence
Le fait est que, au départ, Gaudi3 devait bel et bien rivaliser avec les GPU de Nvidia pour l’entraînement des IA. Mais de l’aveu même d’Intel, ses performances en la matière se sont rapidement relevées décevantes. Intel semble donc revoir ses ambitions à la baisse en matière de GPU. Et c’est dans ce contexte que le futur modèle Crescent Island, qui devrait succéder à Gaudi3 vers la rentrée 2026, semble plus conçu pour l’inférence.
Selon les informations livrées par Intel, il sera composé de cœurs Xe3P, une version améliorée des cœurs graphiques Xe3 intégrés au processeur Core Ultra 3 « Panther Lake », qui doit équiper les prochains PC. Il n’intégrera plus de mémoire HBM. À la place, on trouvera 160 Go de mémoire LPDDR5X. En fait, le principal intérêt de ce GPU serait qu’il pourra fonctionner dans des serveurs refroidis à l’air, donc consommant moins d’énergie que les serveurs refroidis par liquide qui contiennent aujourd’hui des Gaudi 3.
Entre un PDG qui préfère jeter l’éponge dans la course aux puces de calcul les plus puissantes et l’entrée récente de Nvidia au capital d’Intel à hauteur de 4 %, l’avenir des GPU conçus par Intel reste difficilement prédictible.