De l’espace aux bureaux d’étude, HPE veut populariser les supercalculateurs

Le constructeur embarque l’un de ses ordinateurs dans une fusée pour équiper l’ISS en supercalcul. Cette mission spatiale est la première étape d’une campagne de conquête des hautes performances.

HPE compte bien en 2021 se présenter aux entreprises comme le nouveau leader des supercalculateurs. Première étape : l’une de ses machines HPC, le Spaceborne Computer-2 décollera ce 20 février à bord d’une fusée pour rejoindre la station spatiale ISS. Il y exécutera pendant trois ans des traitements sur les images prises depuis l’espace, notamment de la reconnaissance automatique d’objets et de la simulation des événements qui en découlent, grâce aux algorithmes d’IA déjà en service sur Microsoft Azure.

Le Spaceborne Computer-2 doit servir de modèle pour construire ensuite des supercalculateurs d’appoint spécialisés dans l’imagerie et que HPE entend notamment vendre aux laboratoires de recherche pharmaceutique. HPE avait déjà envoyé sur l’ISS un premier supercalculateur en 2017, à titre expérimental. Resté deux ans en orbite, celui-ci n’est non seulement jamais tombé en panne, malgré les conditions extrêmes du voyage dans l’espace, mais il a aussi prouvé qu’il pouvait effectuer des calculs à la vitesse de 1,1 téraflops sans que cela pose un problème d’alimentation électrique. En l’occurrence, la première et la seconde version du Spaceborne Computer consomment entre 300 et 600 watts selon les besoins de la station en énergie.

Des serveurs durcis dans l’espace

Le Spaceborn Computer-2 est en pratique une machine EdgeLine Converged Edge 8000, c’est-à-dire un serveur Proliant 380 accompagné d’une baie de disques Nimble Storage, le tout en deux exemplaires redondants dans des boîtiers durcis. Cette configuration est d’ores et déjà proposée au catalogue de HPE comme une infrastructure hyperconvergée pour les milieux industriels. La version en partance pour l’ISS a, en plus, des cartes GPU pour accélérer ses calculs et un système Red Hat Enterprise Linux qui exécute les applications de l’environnement TRek de la Nasa et communique avec le cloud Microsoft Azure au sol.

À la différence du premier Spaceborne Computer de 2017, cette nouvelle machine est utilisable par les astronautes. Ceux-ci vont pouvoir lui faire simuler leurs expériences, mais aussi remplacer ses SSD et ses barrettes de RAM s’ils venaient à défaillir. Elle est même utilisable depuis le sol par d’autres chercheurs, en passant par le cloud Azure.

« Le bénéfice le plus important du supercalcul dans l’espace est d’apporter aux astronautes des réponses en temps réel sur leurs expérimentations. Ainsi, les explorateurs de l’espace peuvent immédiatement réorienter leurs recherches en s’appuyant sur des données issues de traitements analytiques qui n’ont plus à être exécutés sur Terre », explique Mark Fernandez, en charge des solutions convergées chez HPE, au micro de nos confrères de Computer Weekly.

Il précise que la vitesse de communication entre l’ISS et la Terre est de 2 Mbit/s, avec une latence de pratiquement une seconde. « Bien entendu, le Spaceborne Computer-2 communiquera avec les équipes au sol. Mais sa puissance de calcul servira dans ce cas à compresser les données. »

Rendre le supercalcul accessible aux entreprises, aux bureaux d’études

L’événement autour du Spaceborne Computer-2 devrait marquer le retour de HPE sur le devant de la scène des supercalculateurs en 2021. « Certes, nous ne sommes pas actuellement le numéro 1 du TOP500, mais les entreprises doivent savoir que nous sommes désormais le No 1 en termes de vente de supercalculateurs et de machines dites critiques dans le monde, avec 37 % de parts de marché », lance Jérémy Folon, en charge des supercalculateurs chez HPE France, lors d’une interview accordée au MagIT.

Ces chiffres sont notamment dus au rachat, finalisé il y a quelques mois à peine, de Cray, l’une des grandes marques historiques en HPC. En 2016, HPE avait déjà racheté un autre géant historique du supercalcul : Silicon Graphics (alias SGI). De ce rachat, HPE hérite d’une clientèle déjà présente dans le TOP500, mais aussi de technologies hors pair, comme l’infrastructure réseau SlingShot. Celle-ci est capable de transporter plus de 1,2 milliard de paquets par seconde et par port. En l’occurrence, les liens réseau restent de l’Ethernet, mais ils communiquent en 200 Gbit/s.

HPE propose ce réseau sous la forme de switches 64 ports, avec une bande passante de 12,8 Tbit/s et la capacité de router les paquets vers plus de 250 000 nœuds serveurs. Les cartes réseau capables de communiquer en SlingShot seront cette année livrées avec tous les serveurs HPE de la famille Apollo.

« Notre ambition est de décliner notre savoir-faire en matière de HPC dans des produits accessibles aux entreprises qui mettent en œuvre des applications d’Intelligence Artificielle. »
Jérémy FolonEn charge des supercalculateurs, HPE France

« Nous vendons nos grands supercalculateurs Cray, SGI et Superdome Flex aux très grands comptes de la recherche – en France, citons Total, Renault, les centres du Genci, dont le CEA. Mais notre ambition est de décliner notre savoir-faire en matière de HPC dans des produits accessibles aux entreprises qui mettent en œuvre des applications d’Intelligence Artificielle. Nous voulons adresser de la même manière les bureaux d’études qui, parce qu’ils basculent en télétravail, ont besoin de virtualiser leurs stations graphiques sur des clusters de serveurs hautement performants », explique Jérémy Folon.

Les supercalculateurs historiques nécessitent des installations particulières. Ils sont refroidis à l’eau avec tout un appareillage qui leur fait dépasser les dimensions prévues dans les datacenters et, surtout, qui augmente leur poids jusqu’à atteindre deux tonnes par étagère.

Les Apollo n’ont pas ces contraintes. Ce sont des serveurs x86, Intel ou AMD, qui se présentent sous la forme d’un châssis intégrant plusieurs nœuds : 4 sur le modèle Apollo 2500 et jusqu’à 16 sur le modèle 6500. Ces nœuds peuvent chacun avoir jusqu’à 8 GPU pour accélérer leurs calculs. Chacun de leurs processeurs est accompagné de 768 Go ou 1,5 To de RAM. Outre l’intégration du réseau Slingshot, ces machines ont aussi des bus d’extension particuliers, les SXM2, qui permettent aux processeurs de communiquer avec les GPU dix fois plus rapidement qu’ils ne le feraient avec des bus PCIe classiques.

Par ailleurs, ces machines sont surtout pilotées par le même logiciel qui répartit les calculs dans les grands supercalculateurs : Cluster Performance Manager, développé par HPE.

Des technologies Intel et AMD inédites d’ici à la fin de l’année

« Au-delà des technologies SlingShot et SXM2, nous serons également les premiers à intégrer les solutions équivalentes qu’Intel et AMD préparent actuellement », glisse Jérémy Folon, sans pour autant vouloir lever plus loin le voile de ces produits que les intéressés ne devraient révéler que d’ici à la fin de l’année.

Tout au plus, LeMagIT a cru comprendre qu’il s’agirait notamment d’intégrer la prochaine évolution du réseau Omni-Path sur lequel planche Intel depuis quelques années et qu’il a confié, l’année dernière, à une filiale codétenue par Cornelis Networks.

Il serait aussi question d’intégrer sur les prochains x86 d’Intel et AMD un bus mémoire similaire à celui de l’ARM A64FX, le processeur développé par Fujitsu et installé dans le supercalculateur Fugaku qu’il a vendu au centre de recherche japonais Riken. Cette machine, No 1 du TOP500, est actuellement considérée comme la plus rapide au monde. Elle comprend plus de 7,6 millions de cœurs ARM.

Bizarrement, HPE n’évoque plus ni le refroidissement à l’huile, dont il était l’un des premiers défenseurs, ni le réseau Gen-Z, qui était à la base de son concept de super serveur révolutionnaire par sa modularité, le fameux « The Machine ». Malgré tous ses efforts, LeMagIT n’a pas réussi à obtenir d’explications officielles.

Le défi : trouver des datacenters pour déployer les machines de calcul

« Les entreprises s’attendent à ce que les données à traiter explosent à cause de la multiplication des objets connectés. »
Jérémy FolonEn charge des supercalculateurs, HPE France

Pour autant, Jérémy Folon indique que les défis que HPE devra relever pour convaincre les entreprises d’acheter ses supercalculateurs ne sont pas exclusivement techniques. « Les entreprises s’attendent à ce que les données à traiter explosent à cause de la multiplication des objets connectés, mais elles ignorent dans quelle mesure ni avec quelle régularité elles devront traiter ces données. »

« Par conséquent, la tendance est de ne plus acheter de machines de calcul mais d’en louer l’usage. En pratique, cela signifie que HPE ou ses partenaires commercialiseront surtout du temps de calcul et, donc, qu’il nous incombe de mettre et de maintenir nous-mêmes les machines en production. C’est-à-dire que notre première tâche, en France, va consister à identifier des datacenters dans lesquels nous allons pouvoir entreposer nos machines. »

Selon les informations que LeMagIT a pu obtenir, le premier datacenter dans lequel HPE France devrait implémenter ses Apollo pour offrir des services de supercalcul serait Thésée, dans l’Ouest parisien, qui sort tout juste de terre.

Pour approfondir sur HPC

Close