Processeur : le Rhea1 équipera les supercalculateurs dès fin 2026

Le processeur de l’Européen SiPearl est sorti d’usine et passe les derniers tests de validation de ses fonctionnalités. Il sera ensuite expédié au français Bull pour qu’il assemble l’extension de Jupiter, le premier supercalculateur Exascale d’Europe.

Cette fois, ce sera la bonne. Le Rhea1, le processeur ARM européen conçu pour les serveurs, équipera le supercalculateur Jupiter du centre de recherche de Jülich, en Allemagne, d’ici à la fin de l’année. La puce est sortie d’usine. Elle passe actuellement une batterie de tests pour valider ses fonctionnalités matérielles et logicielles avant de rejoindre, d’ici à 12 semaines, l’usine du français Bull (ex-Eviden) qui la montera dans les clusters de calcul qu’il fabrique pour étendre Jupiter.

« Les premiers résultats sont très encourageants. Ils confirment que le microprocesseur européen haute performance et basse consommation fonctionne conformément à sa conception », se réjouit Philippe Notton, le PDG de SiPearl (en photo en haut de cet article), dans un communiqué.

LeMagIT a parlé pour la première fois de ce processeur en 2019, lorsque l’entreprise française SiPearl a été fondée pour concrétiser le projet EPI (European Processor Initiative) d’une puce européenne pour supercalculateurs. EPI avait été initié par l’Union européenne dans le cadre de son nouveau programme EuroHPC, qui avait pour ambition de développer sur le continent des machines Exascale, capables de traiter au moins un milliard de milliards d’opérations par seconde (alias exaflop/s).

Le fait est que le premier supercalculateur européen Exascale a été mis en production en fin d’année dernière, qu’il s’agit bien de Jupiter et que c’est bien EuroHPC qui pilote son financement. Jupiter (1 exaflop/s) est le quatrième plus puissant ordinateur au monde, derrière les américains El Capitan (1,8 exaflop/s), Frontier (1,35 exaflop/s) et Aurora (1,01 exaflop/s), selon la dernière édition du palmarès Top500. Comme quoi, on peut critiquer la lenteur de la bureaucratie européenne, mais force est de reconnaître que l’UE sait malgré tout mener ses projets à terme.

« Seul CPU haute performance conçu en Europe, Rhea1 est l'élément clé d'une pile de calcul et d’IA souveraine complète. Outre pour ses performances, ses utilisateurs l'apprécieront pour sa sécurité sans backdoor ni kill switch », poursuit le communiqué, en jouant sur la fibre très actuelle de la souveraineté, alias la peur des entreprises européennes de dépendre de technologies que les USA de la fin des années 2020 peuvent couper à tout instant.  

Une mémoire HBM, mais pour accélérer les opérations fonctionnelles

Pour l’heure, la puissance de Jupiter repose sur environ 24 000 processeurs ARM Grace de Nvidia. La variante utilisée est la puce GH200, qui comprend un Grace de 72 cœurs ARM Neoverse V2 et un GPU H100 sur la même puce Superchip. Cette première partie matérielle est appelée le Booster. Elle est composée d’environ 6000 serveurs contenant chacun quatre puces GH200.

L’extension de Jupiter que prépare Bull s’appellera simplement le Cluster. Elle sera composée dans un premier temps de 1300 serveurs additionnels contenant deux processeurs Rhea1 de 80 cœurs ARM Neoverse V1 chacun (soit 208 000 cœurs). Le gros avantage du Rhéa1 est que, contrairement à tous les autres processeurs, il intègre une mémoire HBM de 64 Go. Ailleurs, la mémoire HBM, qui garantit les performances, loge exclusivement dans le GPU.

L’intérêt est énergétique. Les GPU ne sont utiles que pour exécuter des fonctions mathématiques en parallèle. Mais les opérations fonctionnelles qui vont autour - conversion, recopie, réagencement des données - n’ont aucun intérêt à s’exécuter sur un GPU qui consommera quatre à cinq fois plus d’énergie qu’un processeur traditionnel pour les traiter. Grâce à sa mémoire HBM embarquée, le Rhea porte la promesse d’être le premier processeur capable d’accélérer autant ces opérations fonctionnelles que sur un GPU, mais pour à peine 350 watts et pas 1300 comme sur un GH200.

Au-delà des algorithmes scientifiques traités dans les supercalculateurs, cette approche est aussi valable en IA. Seul l’entraînement de modèles tire parti des circuits d’un GPU. Le RAG, l’inférence et l’IA agentique sont accélérés uniquement par la mémoire HBM. Donc autant que cette mémoire HBM soit installée dans le processeur, plus économe en énergie.

La performance de la partie Cluster est estimée, avec 1300 serveurs, à 5 pétaflop/s, soit, sur le papier, 200 fois moins que la partie Booster. Sauf que les pétaflop/s n’expriment que la puissance mathématique. Ils ne disent rien de la vitesse d’exécution des opérations fonctionnelles.

Après Jupiter, SiPearl lancera une seconde génération de processeur Rhea, le Rhea2, pour équiper le futur supercalculateur Exascale Alice Recoque qui, lui, sera installé en France, au CEA. Comme Jupiter, Alice Recoque sera construit par le français Bull.

Pour approfondir sur ARM