Bamboo : « les serveurs ARM se vendront plus que les x86 d’ici à 2027 »

Le fabricant de serveurs ARM lancera bientôt de nouveaux modèles basés sur le processeur Altra d’Ampere. Ces machines seraient plus optimales pour exécuter les applications en containers.

Le fabricant de serveurs Bamboo en est persuadé : 2022 sera l’année charnière à partir de laquelle les machines x86 se vendront de moins en moins. S’appuyant les observations régulièrement mises à jour du cabinet IDC, Tony Craythone, le PDG de Bamboo, estime qu’il se vendra autant de serveurs ARM que de serveurs x86 vers 2027, puis que les serveurs ARM domineront les ventes mondiales, lesquelles devraient représenter 100 milliards de dollars vers 2030.

Ça tombe bien, puisque l’activité de Bamboo est justement de fabriquer des serveurs ARM. 2022 sera d’ailleurs l’année lors de laquelle il lancera de nouveaux modèles, a priori appelés B1000A et B2000A, sur la base du dernier processeur Altra d’Ampere, une sorte d’équivalent au M1 d’Apple, mais doté de 80 cœurs et conçu pour les serveurs. Vers le milieu de l’année, Bamboo devrait également présenter des modèles B1000AX et B2000AX, cette fois-ci équipés du processeur Altra Max d’Ampere, toujours gravé avec une finesse de 7 nm, mais intégrant 128 cœurs.

« Désormais, 50 % des serveurs qui animent le cloud public d’Azure sont basés sur des processeurs ARM. VMware, l’éditeur numéro 1 des solutions d’infrastructure, a annoncé l’année dernière l’arrivée d’une version ARM de son hyperviseur ESXi. Le marché est véritablement en train de basculer », lance Andy Hill, le directeur commercial de Bamboo, lors d’un entretien avec LeMagIT.

« L’avantage des processeurs ARM est que la croissance de leur performance reste linéaire au fur et à mesure que vous activez des cœurs, alors qu’un processeur x86 de 28 cœurs est moins performant que deux processeurs x86 de 12 cœurs. Cela signifie que, à puissance égale, vous pouvez avoir des serveurs ARM plus compacts, moins chers et moins énergivores que leurs équivalents en x86 », argumente-t-il.

Outre Azure, AWS avait déjà déployé des serveurs ARM pour animer son cloud public avec un processeur qu’il a lui-même développé, le Graviton. Oracle a récemment fait de même pour son cloud public OCI, avec des processeurs Altra, justement.

Les serveurs ARM meilleurs pour exécuter des containers en parallèle

Plus précisément, Andy Hill reconnaît que les processeurs ARM sont actuellement moins rapides que les processeurs x86 pour exécuter des applications monolithiques, car la performance de ces applications est conditionnée par la vitesse brute de chacun des cœurs sur lesquels elles répartissent leur code. Cependant, ces applications utilisent rarement un très grand nombre de cœurs.

Pour des questions de rendement énergétique et de place occupée dans un datacenter, les entreprises optent pour des processeurs multicœurs avec l’idée d’exécuter un maximum d’applications en même temps sur un seul processeur. Toutefois, cette cohabitation pénaliserait les performances individuelles de chaque application sur un processeur x86 – mais pas sur ARM – au point que l’intérêt de tout condenser deviendrait discutable au-delà d’un certain nombre d’applicatifs exécutés en même temps.

Et le problème serait exponentiel avec les nouvelles applications au format container. Dans ce format, les applications sont découpées en modules indépendants, les microservices, qui utilisent chacun un minimum de cœurs.

Les containers constituant désormais la norme pour les applications conçues dès le départ pour le cloud, les entreprises auraient tendance à vouloir s’équiper des matériels les plus optimisés pour les exécuter. Dans ce contexte, les performances individuelles de chaque container resteraient les mêmes, quel que soit leur nombre et dans la limite des cœurs disponibles sur un processeur ARM. En revanche, elles chuteraient sur un processeur x86 au fur et à mesure que ses cœurs sont chacun mobilisés par des containers indépendants.

« En moyenne, adapter une application entière à un serveur ARM ne prend qu’une heure et demie, le temps de la recompilation automatique du code. »
James PeckExpert avant-vente, Bamboo

Reste qu’en pratique les entreprises redoutent encore de porter leurs applications sur ARM. James Peck, l’expert avant-vente de Bamboo, explique que la contrainte n’est pas technique, mais uniquement culturelle : « Les entreprises ont déjà commencé à redévelopper leurs applications au format container, mais en code x86. Elles nous disent qu’elles n’ont pas nécessairement envie de faire l’effort supplémentaire de réécrire une nouvelle fois leurs applications en code ARM. Elles craignent en effet que le portage d’une architecture à l’autre leur coûte des semaines supplémentaires de travail, comme cela a déjà été le cas pour passer d’un format monolithique à un format container. Mais c’est une idée totalement fausse ! »

« Les serveurs ARM fonctionnent avec exactement le même écosystème de logiciels que les serveurs x86. En moyenne, adapter une application entière à un serveur ARM ne prend qu’une heure et demie, le temps de la recompilation automatique du code », précise-t-il. « Sur serveurs ARM, vous retrouvez les mêmes Linux Red Hat, Ubuntu et CentOS. Le même Kubernetes, le même MySQL, le même MongoDB, le même TensorFlow, le même Apache, le même Elasticsearch… »

Selon Bamboo, il existerait à l’heure actuelle plus de 127 000 plateformes logicielles, applicatifs, ou modules, qui existeraient au format container pour serveurs ARM.

« Dans de nombreux cas, les entreprises nous achètent des serveurs pour réinternaliser dans leurs datacenters les applications qu’elles ont directement déployées chez AWS sur des machines virtuelles ARM », intervient Andy Hill.

L’argument des performances par watt

James Peck veut aussi battre en brèche l’argument de la vitesse de calcul brute par cœur, cette fois-ci que les applications soient monolithiques ou en containers.

« On parle de plus en plus de performances par watt », intervient Andy Hill. « L’un de nos clients, dans le secteur pétrolier, a ainsi testé qu’un cluster de 16 serveurs Dell R640 déployant 896 cœurs x86 délivrait les mêmes performances qu’un cluster de 8 serveurs Bamboo B1000N qui déploie 1 024 cœurs. Sauf que le cluster x86 occupe deux fois plus d’espace, consomme jusqu’à 14 600 watts, contre 3 800 watts pour le nôtre, et coûte 616 000 dollars contre 256 000 dollars dans notre cas », dit Andy Hill.

En l’occurrence, chacun de ces serveurs est de taille 1U. Un Dell R640 contient deux processeurs Xeon de 28 cœurs chacun, soit un total de 896 cœurs pour l’ensemble. Un B1000N est quant à lui basé sur huit processeurs ARM contenant chacun 16 cœurs Cortex A72, soit un total de 1 024 cœurs.

Cette génération-là de processeurs ARM n’intégrait pas beaucoup de cœurs, mais consommait si peu qu’on pouvait en mettre un grand nombre dans un serveur. La prochaine génération aura moins de processeurs, mais plus de cœurs : les B1000A et B1000AX n’auront plus qu’un processeur (avec 80 et 128 cœurs, respectivement), tandis que les B2000A et B2000AX en auront deux (soit 160 et 256 cœurs), dans un boîtier 2 U.

Comme ces processeurs Altra Max seront plus puissants que les Cortex A72, le cluster de 16 serveurs Dell R640 pourrait se comparer à un cluster de 7 serveurs Bamboo B1000AX, qui totaliserait aussi 896 cœurs, occuperait 56 % d’espace en moins et consommerait seulement 2 900 watts, soit 80 % d’électricité en moins.  

Pour approfondir sur Processeurs et composants

Close