Intel ne renonce finalement pas à imposer ses GPU dans les serveurs. À l’occasion de l’événement OCP 2025 consacré aux innovations matérielles pour datacenters et qui se tient cette semaine en Californie, le fondeur américain a dévoilé le design d’un cluster de calcul basé sur sa puce Gaudi3, ainsi que le détail de son futur GPU, pour l’heure appelé Crescent Island.

Le cluster d’Intel comprend 32 nœuds de calcul contenant chacun un processeur Xeon 6700, 2 GPU Gaudi3 contenant chacun 128 Go de mémoire HBM2E et une mémoire HBM3 de 64 Go partagée entre les trois composants (Intel parle de HBD, pour High Bandwidth Memory Domain). On note qu’Intel ne propose pas ici de Xeon Max, la version du Xeon qui intègre 64 Go de HBM directement dans sa puce.

Similaire dans son format au cluster de calcul DGX GB200 NVL72 de Nvidia, ce design d’Intel se présente sous la forme de 16 serveurs contenant chacun deux nœuds de calcul. L’ensemble est refroidi par liquide.

Contrairement au DGX de Nvidia, cette machine n’a pas vocation à entraîner des IA. Elle est conçue pour l’inférence, soit l’exécution d’IA préentraînées. Pour un hébergeur de calcul, l’intérêt de ce cluster est que les GPU Gaudi3 consommeraient chacun 600 watts d’énergie sur les travaux d’inférence, alors que les B200 de Nvidia, conçus pour l’entraînement, consomment au moins le double.

Intel avait lancé Gaudi3 en 2024. Jusqu’ici, ses ventes n’avaient jamais vraiment décollé.