Processeurs : Intel dévoile sa cinquième génération de Xeon Scalable
Le fondeur a présenté cette semaine à New York des versions améliorées – plus de cœurs, plus de cache – de ses processeurs pour serveurs. L’objectif semble de proposer plus de rendement que véritablement battre des records de vitesse.
Alors qu’AMD vient tout juste de dévoiler de nouvelles puces MI300X (GPU) et MI300A (CPU+GPU) censées concurrencer Nvidia en matière de puissance de calcul, Intel réplique avec le lancement d’un nouveau processeur Xeon et l’officialisation de la sortie du GPU Gaudi 3 pour 2024. En revanche, contrairement à AMD et Nvidia, Intel ne présente pas encore de super puce qui intègre à la fois des cœurs de processeurs et d’autres de GPU.
Concernant Gaudi 3, Pat Gelsinger, le PDG d’Intel (à droite sur la photo), n’a pas livré beaucoup plus d’informations que celles que l’on connaissait déjà. Il s’agira d’un GPU contenant 144 Go de RAM HBM 3 et qui sera capable de communiquer avec ses pairs comme avec des baies de stockage via 48 canaux cumulables d’environ 10 Go/s chacun.
Pour mémoire, Intel a en ce moment deux lignes de GPUs. Les Gaudi 2 ont 24 cœurs Tensor, 96 Go de RAM HBM et sont vus comme des modèles de GPU économiques qui servent plus à exécuter des modèles d’IA préentraînés qu’à les entraîner en amont avec du Machine learning. Les GPU Max, avec leurs 1 024 cœurs Tensor et leurs 128 Go de RAM HBM, sont, eux, conçus pour le supercalcul.
Jusqu’ici évoqué sous le nom de code Emerald Rapids, le Xeon Scalable de cinquième génération serait quant à lui 21 % plus rapide en vitesse brute que le Xeon de quatrième génération. Et même 36 % plus performant, si l’on prend en compte que cette accélération va de pair avec une consommation électrique inférieure. Accessoirement, les unités vectorielles ont été spécialement améliorées et permettraient d’exécuter les algorithmes d’inférence (exécution sur des données locales de modèles d’IA préentraînés) de 42 % par rapport aux Xeon précédents.
Globalement, le dessin des circuits diffère par rapport aux modèles actuels pour augmenter le nombre de cœurs et multiplier par trois la quantité de cache. Pour autant, de l’aveu même d’Intel, les nouveaux Xeon sont plus une mise à jour des Xeon de quatrième génération, avec des cœurs similaires, quoiqu’un peu plus optimisés, qu’une véritable nouvelle génération. Les cinquième et quatrième générations seront d’ailleurs interchangeables sur les cartes mères des serveurs.
Les nouveaux Xeon doivent intégrer les serveurs dès le début de l’année 2024.
Une trentaine de modèles de Xeon pour tous les cas d’usage
Toujours gravé avec une finesse de 10 nm, selon un procédé qu’Intel appelle « Intel 7 », le nouveau Xeon se présente sous trois variantes de circuits accolés qui peuvent désormais grimper jusqu’à un total de 64 cœurs et 320 Mo de cache. Telles sont les caractéristiques du nouveau modèle le plus haut de gamme, le 8592+, dont la fréquence varie de 1,9 à 3,9 GHz, pour une enveloppe thermique de 350 Watts.
Une trentaine de modèles a été présentée, dont une vingtaine d’entre eux sont conçus pour les serveurs bisocket. Il s’agit d’autant de variations avec moins de cœurs et moins de cache pour consommer moins d’énergie. Et aussi coûter moins cher. Au bas de l’échelle, le Xeon 4 509Y avec 8 cœurs, 22,5 Mo de cache et une fréquence variable entre 2,6 et 4,1 GHz, n’a plus qu’une enveloppe thermique de 125 watts. Ce modèle-là est présenté à un tarif indicatif de 563 dollars l’unité, alors que le 8592+ coûte 11 600 dollars.
À côté des modèles pour serveurs bisocket, on retrouve des modèles pour serveurs monosockets (dont la référence se termine par la lettre U), pour les équipements réseau (référence N), pour les hyperscalers (référence P pour l’IaaS ou V pour le SaaS), pour les baies de stockage (S) et les équipements durcis (T).
Les cœurs sont soit répartis sur deux gros circuits de 32 cœurs chacun (configuration XCC), soit un ou deux circuits de 16 cœurs chacun (configurations MCC et EE LCC). Pour rentabiliser ses coûts de production, Intel recycle les circuits imparfaits dans des processeurs qui présentent moins de cœurs utilisables. Un Xeon de 48 cœurs a ainsi deux gros circuits qui ont chacun 32 cœurs, dont 8 sont inutilisables. Un Xeon de 24 cœurs repose sur deux circuits de 16 cœurs qui ont chacun 4 cœurs inutilisables. Un Xeon de 8 cœurs a un circuit de 16 cœurs, dont 8 sont inutilisables. AMD fait exactement la même chose.
À terme, Intel devrait lancer une configuration de son nouveau Xeon comportant 144 cœurs. Elle aurait trois circuits de 32 cœurs et trois de 16 cœurs. On attend également la version Xeon Max qui, elle, intégrera de la mémoire HBM à côté des circuits.
Maintenir la concurrence face aux Epyc, sans faire la course
Comparativement aux processeurs AMD de dernière génération, les plus puissants de ces nouveaux Xeon acceptent des barrettes mémoire très rapides DDR5-5600 ou DDR-5200, les moins puissants s’accompagnent de barrettes mémoire économiques DDR5-4400. Tous les derniers Epyc d’AMD, eux, fonctionnent avec des barrettes de mémoire intermédiaires DDR5-4800. Les deux marques prennent en charge à présent la même capacité de RAM maximale, soit 6 To par socket.
En revanche, les processeurs AMD Epyc offrent un meilleur ratio nombre de cœurs/prix dans le haut de gamme. Ainsi, pour 11 800 dollars, l’Epyc 9654 dispose, lui, de 96 cœurs. En 32 cœurs, le Xeon 8562Y+ coûte près de 6 000 dollars, alors que l’Epyc 9354 coûte à peine plus de 3 400 dollars. La tendance s’inverse vers le milieu de gamme : en 24 cœurs, un Xeon 4516Y+ coûte moins de 1 300 dollars, quand un Epyc 9254 est au tarif de 2 300 dollars.
On note par ailleurs que les Xeon n’adressent toujours pas plus de 80 canaux PCIe. Les Epyc en gèrent 128. Il faut compter 16 canaux PCIe 5.0 pour connecter une carte GPU et 4 canaux pour un SSD NVMe.
De son côté, AMD n’a pas annoncé de lancement imminent d’une nouvelle génération d’Epyc. Au contraire, même. Il a récemment remis sur le marché des Epyc de génération précédente, au prétexte de proposer des configurations à prix cassés pour la majorité des entreprises qui n’ont plus besoin de performances dernier cri afin d’exécuter leurs applications.
En proposant des Xeon de cinquième génération plus avantageux que véritablement plus accélérés, Intel semble adhérer à la même analyse : les entreprises ont plus besoin d’un meilleur rendement que de nouvelles performances.