Cray va livrer un cluster de plus de 10 pétaflops aux laboratoires d'Oak Ridge

Dans le cadre d'un contrat évalué à près de 100 M$, le spécialiste des supercalculateurs va livrer aux laboratoires d'Oak Ridge du ministère de l'énergie US un supercalculateur baptisé Titan qui, au fur et à mesure de ses évolutions, sera capable de fournir une puissance de calcul allant de 10 à 20 pétaflops. Le système est un Cray XK6, la dernière génération de supercalculateurs Cray, à base de puces Opteron et d'accélérateurs GPU NVidia Tesla.

Un Cray XK6

Le spécialiste américain des supercalculateurs Cray a annoncé aujourd'hui avoir remporté le contrat pour la modernisation du supercalculateur Cray XT5 surnommé «Jaguar», située dans les laboratoires d'Oak Ridge (ORNL, Oak Ridge National Laboratories) du ministère de l'Énergie (DOE) US. Les laboratoires ont commandé au constructeur un système Cray XK6 supercalculateur, dont le nom de code sera "Titan", et qui, une fois achevé, aura une performance comprise entre 10 et 20 pétaflops. Le système combinera des puces x86 Opteron d'AMD à 16 coeurs (nom de code "Interlagos") avec les accélérateurs Tesla de NVidia. L'objectif affiché de Titan est de permettre d'accélérer les travaux de recherche US sur les nouvelles énergies.

Gemini : le bus au coeur du XK6

Dernier né des systèmes Cray, le XK6 est un système hybride qui permet d'interconnecter jusqu'à 125 000 noeuds serveurs quadri-socket Opteron chacun doté d'un maximum de 2 accélérateurs Nvidia au travers d'un bus de connexion propriétaire baptisé "Gemini".

Ce système d'interconnexion - fruit de travaux partiellement financés par la DARPA - s'appuie sur une architecture en tours 3D, à l'instar de ce que propose aussi Fujitsu pour son système K. Gemini permet selon Cray de fournir un maximum de 20 Go/s de bande passante à chaque noeud et peut gérer des dizaines de millions de messages MPI par seconde.

Gemini permet aussi de créer un espace mémoire unique, adressable via RDMA (Remote Direct Memory Access) par l'ensemble des noeuds du cluster. Ce système est un peu différent du système Numalink Silicon Graphics, où l'ensemble des noeuds d'un système partage la même copie du système d'exploitation. Dans le cas de Cray, chaque noeud dispose de son propre OS Linux mais les applications peuvent disposer d'un espace mémoire partagé entre plusieurs noeuds.

Du fait de l'architecture hybride du cluster XK6, les laboratoires d'Oak Ridge et Cray ont spécifiquement travaillé sur l'optimisation du code des logiciels afin de tirer parti à la fois des capacités des CPU et des GPU. L'environnement de programmation que proposera Cray à l'ORNL permettra aux chercheurs de continuer à utiliser Fortran, C et C + + pour programmer les nouveaux accélérateurs.

Reconquérir le premier rang mondial

En 2008, le prédecesseur de Titan, Jaguar, s'était hissé au premier rang mondial du classement des supercalculateurs avec une performance soutenue de plus d'un petaflops. Titan ambitionne de renouveler la performance et de détrôner l'actuel leader du classement, le supercalculateur K, construit au Japon par Fujitsu pour l'institution Riken.

Le montant du contrat pour le remplacement du Cray XT5 par un XK6 est estimé à 97 millions de dollars. La première tranche des travaux -60 M$ - devrait être achevée dès la fin 2011 avec l'installation de nouvelles lames "Interlagos" couplées aux accélérateurs Tesla Series 20 de Nvidia. La seconde tranche, prévue pour le premier semestre 2012, consistera à installer la nouvelle génération d'accélérateurs NVidia (nom de code "Kepler") pour doper encore un peu plus les performances. Les accélérateurs "Kepler" pourraient être dévoilés par NVidia lors du prochain salon Supercomputing de Seattle, en Novembre.

Cray confirme le retard des puces AMD "Interlagos"

Une lame XK6 avec ses 4 puces Opteron et ses adaptateurs Nvidia
(présents à gauche et absents à droite)

Notons au passage que l'annonce du contrat a été l'occasion pour Cray de confirmer le retard pris par AMD dans la livraison de ses nouvelles puces Interlagos, qui étaient à l'origine attendues au début de l'été et qui n'ont commencé à être livrées qu'à la toute fin du 3e trimestre. En cause : des problèmes rencontrés par GlobalFoundries pour améliorer les rendements de son processus de gravure en 32nm à l'usine de Dresde. Ces retards ont déjà coûté leurs postes à la directrice du site de Dresde, mais aussi au patron de l'activité serveur d'AMD.

Malgré ce retard, Cray espère toujours terminer l'installation de la première tranche de Titan avant la fin 2011 ( et donc facturer cette tranche, ce qui on s'en doute est important pour ses résultats financiers). L'annonce officielle des puces Interlagos doit intervenir en novembre, sans doute aussi lors du salon Supercomputing. En principe, Dell et HP pourraient profiter de l'annonce pour dévoiler un rafraîchissement de leurs gammes de serveurs d'entreprises.

Pour approfondir sur HPC

Close