Un cluster chinois devrait prendre la tête du classement des supercalculateurs mondiaux

A dix jours de l'ouverture du salon Supercomputing 2010 de la Nouvelle Orléans et de la publication de l'édition d'automne du Top500, qui classe les 500 premiers supercalculateurs mondiaux, la Chine a créé la surprise en annonçant la mise en service à l'université de Tianjin de Tianhe-1A, un nouveau supercalculateur doté d'une performance LinPack de 2,5 PFlops. Un score qui devrait en faire le plus rapide des supercalculateurs mondiaux dans le Top500.

En juin dernier, la Chine avait déjà réussi à loger deux clusters dans les dix premiers rangs du classement des 500 premiers supercalculateurs mondiaux, le Top500. Une première pour un pays jusqu'alors très en retard dans la course au calcul hautes-performances (HPC). Mais en ce domaine comme en d'autres, les chinois se sont fixés des objectifs ambitieux et ont la volonté de s'imposer au premier rang.

Lors de la parution du classement de juin, le cluster chinois Nebulae, à base de lames Xeon X5650 et de GPU NVidia Tesla, s'était emparé du second rang mondial avec un score de 1,27 PFlops (Rmax) au benchmark LinPack, derrière le cluster Jaguar des laboratoires d'OakRidge (Ministère de l'énergie US) avec 1,75 PFlops. Un second cluster chinois, Tianhe-1 (littéralement, "voie lactée"), construit pour la modique somme de 88,5 M$ avait pris le septième rang avec un score de 563 TFlops.

C'est ce dernier cluster, à l'époque motorisé par 6144 Xeon X55xx (Nehalem-EP) et par 5120 GPU ATI Radeon HD4870, qui a été singulièrement dopé cet automne. A l'origine le plan était d'atteindre 800 GFlops avant la fin 2010, mais l'université nationale des technologies de défense a semble-t-il mis le pied sur l'accélérateur. Désormais le cluster incorpore 7168 GPU Nvidia Tesla M2050, pilotés par 7168 noeuds serveurs bi-processeurs  à base de puces Xeon X56xx. Un processeur chinois, le Fentai-1000 fait aussi partie de la configuration et se charge semble-t-il de l'interconnexion des noeuds (un point qui reste toutefois à préciser car aucune information publique ne semble disponible sur cette puce, développée par l'académie nationale des technologies de défense.


Un cluster hybride d'une puissance de 2,5 petaflops (LinPack)
Cette cure de vitamines a eu l'effet escompté sur les performances LinPack. Le nouveau Tianhe-1A est ainsi crédité de 2,5 Pflops, un chiffre qui, semble-t-il, ne devrait pas être dépassé lors de la publication du prochain classement Top500. Les Américains devraient donc au moins brièvement perdre la tête du classement (ce qui était déjà arrivé entre les années 2002 et 2004 avec la domination du classement Top500 par le supercalculateur de la météo japonaise, le fameux "Earth Simulator", avant qu'il ne soit dépassé par le BlueGene/L d'IBM).

Reste que la course aux performances Linpack n'est pas une fin en soit. On notera ainsi que l'efficacité de Tianhe-1 est toute relative, le score LinPack étant inférieur de plus de moitié à la performance maximale théorique du cluster. De plus, il reste encore délicat de tirer parti des performances des GPU et dans certains codes, l'efficacité est inférieure à 10% de la puissance théorique. Autant dire, que Tianhe-1, comme nombre des clusters utilisant des GPU ne sera réellement utile que pour certains type de workloads.

Cela n'enlève toutefois rien au mérite des ingénieurs chinois qui ont utilisé les recettes hybrides inaugurées en 2009 par les américains avec la mise en service de Roadrunner, le premier cluster petaflopique qui mariait puces X86 (en l'occurence des Opteron d'AMD) avec des co-processeurs Cell.

En France, quelques supercalculateurs se sont essayés à l'hybride notamment dans le domaine financier, mais aussi dans le monde de la recherche avec notamment le cluster Iblis du CINES et dans les laboratoires de recherche, les développements autour des GPU en France se multiplient. Toutefois, les plus grandes machines de recherche hexagonales restent à ce jour très conventionnelles comme l'atteste l'architecture du cluster Tera-100 de la direction des applications militaires du CEA (1,25 PFlops uniquement à base de Xeon 7500) ou celle du cluster Jade du CINES à Montpellier (237 GFlops à base de Xeon X5472 et Xeon X5560).

A lire aussi sur LeMagIT :

Tera 100 : le CEA met en ligne le premier calculateur petaflopique français, mais à usage militaire

Bull mise sur une nouvelle génération de grands serveurs x86

Top 500 des supercalculateurs : l'AMD Opteron truste le podium, le premier Français 28ème

Fabio Gallo, Bull : « pour nous, le marché du HPC est stratégique »

BNP Paribas convertit une partie de ses simulations au processeur graphique NVidia

En savoir plus :

Le site du centre national de supercalcul de l'Université de Tianjin

Le communiqué de l'agence Chine Nouvelle

Pour approfondir sur HPC

Close