Google a lui aussi mis au point un processeur ARM : l’Axion

Ce processeur, prétendument plus performant et moins énergivore que tout ce qui existe, pourrait servir à commercialiser des machines virtuelles plus rentables sur GCP.

Google a désormais son propre processeur ARM pour motoriser des services plus économiques sur son cloud GCP : Axion. Sans vraiment donner de détails à propos de cette puce, Google prétend qu’elle serait plus rapide que tous les autres processeurs x86 ou ARM disponibles sur le marché.

« L’Axion est 50 % plus performant et 60 % moins gourmand en énergie que les actuels x86 d’Intel et d’AMD. Il est aussi 30 % plus performant que le plus performant des processeurs ARM », a résumé Mark Lohmeyer, le patron des infrastructures de calcul et d’IA chez GCP, lors d’une séance de questions-réponses avec la presse.

La manière dont Google présente son Axion suggère qu’il l’utilisera pour commercialiser des machines virtuelles ARM économiques dans ses offres IaaS, comme le font déjà les clouds concurrents Azure, OCI et AWS. Jusqu’ici, Google a plutôt utilisé des processeurs ARM pour exécuter des services fonctionnels, PaaS ou SaaS sur GCP. Citons la plateforme Youtube Ads, le moteur Google Earth, les services de stockage en ligne, les services de bases de données BigTable ou BigQuery, etc. Depuis ce mois-ci, il propose des VM Tau T2A reposant sur des processeurs ARM.

L’utilisation de processeurs ARM moins énergivores en cloud est un argument financier que les entreprises clientes peuvent intégrer à leur bilan RSE pour montrer combien elles adoptent une attitude écoresponsable. Chaque hyperscaler propose des outils pour évaluer le bilan carbone de leurs services. Les processeurs ARM ne sont pas adaptés à l’exécution d’applications historiques déjà écrites en code x86. Ils représentent en revanche une opportunité comptable pour les applications modernes que les entreprises compilent elles-mêmes avec des kits de développement dits web-natifs.

Un nouvel ARM de classe Neoverse V2

On ignore à quel autre processeur ARM Mark Lohmeyer fait référence dans sa comparaison. AWS était jusque-là le seul à avoir mis au point ses propres processeurs ARM, les Graviton. Le dernier modèle Graviton4, tout juste dévoilé en fin d’année dernière, doit à terme servir à exécuter les machines virtuelles de sa prochaine offre IaaS R8g. Tous les autres fournisseurs de cloud utilisent les processeurs ARM du fabricant Ampere.

De fait, il est permis de supposer que Google compare l’Axion à l’AmpereOne d’Ampere. Ce processeur avait été déployé en septembre dernier sur GCP. Oracle l’utilise également sur les serveurs de son cloud OCI. Le processeur AmpereOne a succédé en 2023 à l’Ampere Altra, lequel était déjà exploité depuis 2021 par Azure, GCP et OCI.

Cela dit, les comparaisons de Google sont à prendre, à ce stade, avec des pincettes. Un AmpereOne a beaucoup plus de cœurs que les processeurs Intel Xeon et AMD Epyc – jusqu’à 192 cœurs, soit entre 3,5 et 2 fois plus que ses concurrents – mais consomme autant qu’eux, soit 200 à 350 W. Par ailleurs, si un AmpereOne exécute plus de flux en parallèle, aucun benchmark ne démontre qu’il les exécute individuellement plus rapidement.

Le message de Google, peu clair, suggère donc que l’Axion aurait entre 84 et 144 cœurs, soit 50 % de plus que les meilleurs Xeon et Epyc, respectivement. Et chacun de ces cœurs calculerait 30 % plus rapidement que ceux de l’AmpereOne.

Google dit ainsi avoir implémenté dans l’Axion des cœurs Neoverse V2 – comme dans le processeur ARM Grace que Nvidia devrait finir par fournir plus tard cette année. Cette architecture est l’une des deux déclinaisons de la toute dernière génération Armv9 64 bits qu’ARM a conçue pour les datacenters. Neoverse V2 favorise la puissance de calcul par cœur, tandis que Neoverse N2 – utilisé dans l’AmpereOne – mise sur des cœurs qui chauffent moins, pour en mettre un maximum dans la même puce. L’Altra, pour sa part, utilisait des cœurs Neoverse N1.

Le plus étrange concerne la consommation d’énergie : la réduction de 60 % annoncée par Google suggère une enveloppe comprise entre 80 et 140 W pour l’Axion, ce qui paraîtrait pour le moins extraordinaire. Il est cependant possible que les taux indiqués par Google dissimulent des mesures plus alambiquées, comme le font régulièrement les fabricants de puces pour serveurs.

Par exemple, si l’on divise 350 W par 192 cœurs plutôt que par 64 (Xeon 8592+) ou par 96 (Epyc 9654), on calcule que les cœurs consomment individuellement moins de watts sur l’Axion que chez ses concurrents. Autre exemple, avec un nombre de cœurs plus important, plus de VMs s’exécuteraient dans un seul serveur Axion, il y aurait donc moins d’interconnexion réseau à alimenter et ce serait plutôt la consommation d’énergie à l’échelle d’un cluster qui diminuerait.

Mais ce sont des calculs bancals, car les cœurs x86 exécutent deux flux d’instruction à la fois, là où des cœurs ARM n’en exécutent qu’un seul.

Beaucoup de concurrence sur les architectures ARM

Outre le Grace de Nvidia, le Graviton4 d’AWS et l’AmpereOne d’Ampere, l’Axion sera également comparé à terme avec le Cobalt 100, un nouveau processeur ARM mis au point par Azure et aussi annoncé en fin d’année dernière. Le Cobalt 100 sera constitué de deux circuits comprenant chacun 64 cœurs Neoverse N2, c’est-à-dire les plus économes en énergie. Cette économie d’énergie permettra à Azure de faire fonctionner le Cobalt 100 à des fréquences comprises entre 2,1 et 3,6 GHz.

Plus tard, sans doute d’ici au début de l’année 2025, Ampere devrait lancer les premiers processeurs basés sur les nouveaux cœurs Neoverse N3 ou V3 qu’ARM a dévoilés en février dernier. Ces puces implémenteront le protocole CXL 3.0, qui permettra à un serveur d’utiliser les GPUs et la RAM d’autres serveurs en réseau comme s’il s’agissait de ses propres composants.

Pour l’heure, les serveurs des hyperscalers peuvent au mieux bénéficier d’accélérations sur les transferts de données avec des baies de stockage. GCP en bénéficie au travers de cartes Ethernet Titanium, basées sur des puces accélératrices IPU d’Intel.

La technologie CXL 3.0 est très attendue par les hyperscalers, car elle leur permettra de déployer des designs beaucoup plus flexibles et plus rentables. Il est probable que les hyperscalers se rééquiperont en 2025 de puces Ampere en attendant d’implémenter eux-mêmes les cœurs Neoverse V3/N3 dans leurs Axion, Graviton et Cobalt respectifs, a priori un an plus tard.

Google a été le premier des hyperscalers à mettre au point ses propres puces. Avant l’Axion, les services de GCP bénéficiaient déjà d’une puce TPU, qui accélère l’inférence sur les applications d’intelligence artificielle comme la gestion des containers Kubernetes, et d’une puce VCU, qui accélère l’encodage des vidéos sur YouTube. Reste à savoir si cette plus longue expérience lui a permis d’implémenter dans l’Axion le meilleur processeur ARM de la génération Neoverse N2/V2.

Pour approfondir sur ARM

Close