Mais l'impact le plus grand de QPI dans les premiers mois de son existence devrait se faire sentir dans un segment stratégique, celui des serveurs de très haut de gamme. QPI va en effet remplacer le vieux bus des puces Itanium et doper sérieusement la bande passante des puces haut de gamme d'Intel. Chaque puce Tukwila sera dotée de quatre bus QPI pleine largeur et de deux bus demi-largeur. Avec un tel équipement, la bande passante entre les processeur devrait être multipliée par neuf, tandis que l'intégration de deux contrôleurs mémoires dans chaque processeur devrait aussi accroître par un facteur de six la bande passante mémoire. De quoi redonner un coup de jeune à une architecture dont les fondements en entrées/sorties n'avaient guère évolués depuis 10 ans.
QPI devrait aussi permettre une refonte en profondeurs des architectures des grands systèmes SMP Itanium. Architecturalement, HP pourrait ainsi renouer avec des concepts de design qu'il avait déjà utilisé avant le lancement des premiers Superdome sur ses serveurs V2500. A l'époque, HP avait développé une architecture baptisée Scalable Computing Architecture; en fait une architecture à base de crossbar permettant d'interconnecter plusieurs systèmes entre eux pour les faire apparaître comme un seul grand système cc-Numa (voir à ce propos l'illustration ci-dessous).

Il semble que ce soit ce genre de concept sur lequel travaillent plusieurs constructeurs familiers de l'architecture Itanium, dont Bull et HP. L'idée est en fait de développer un chipset, agissant comme un commutateur QPI et qui serait aussi capable de gérer la cohérence de cache entre les systèmes reliés par le commutateur.
Vers des serveurs Itanium haut de gamme plus modulaires ?
Dans la pratique, un serveur Itanium haut de gamme pourrait ressembler à un agrégat de plusieurs systèmes autonomes, chacun disposant typiquement de 4 processeurs et de deux chipsets cc-Numa, le tout interconnecté par des bus QPI afin d'assurer une redondance optimale. Selon les besoins, chaque cellule de 4 processeurs pourrait être reliée à d'autres pour constituer un système de plus grande taille, ou être totalement séparée afin de constituer une partition autonome. Une telle architecture pourrait être physiquement packagée dans un châssis de serveur lames haut de gamme (ce serait l'idée d'HP pour ses prochains systèmes Itanium), où le fond de panier assure les communications inter-lames et les communications entre lames et cartes d'entrée/sorties.
Notons au passage qu'un tel concept pourrait aussi s'appliquer à l'élaboration de systèmes x86 SMP massif utilisant des puces Xeon "Nehalem" EP. L'avantage d'un chipset de commutation QPI serait en effet un relatif agnosticisme vis à vis de l'architecture processeur utilisée. C'est vraisemblablement l'un des axes de recherche de Bull dans le cadre du développement de sa solution d'agrégation de systèmes, car une telle solution aurait aussi des bénéfices dans certains scénarios HPC x86.
L'ensemble des constructeurs concernés (HP, Bull, NEC, Fujitsu et Hitachi) devraient commencer à lever le voile sur leurs plans au cours du dernier trimestre 2008; les premiers serveurs Itanium de nouvelle génération étant attendus au premier semestre 2009. On saura alors jusqu'à quel point les constructeurs de l'écosystème Itanium ont été créatifs…
En savoir plus :
Un Powerpoint assez détaillé sur l'architecture de l'Itanium Tukwila
Les concepts de l'architecture SCA des anciens HP 9000 V2500















