Un cluster de stockage intelligent ultra dense. La startup néo-zélandaise Novodisq met au point un châssis rack de seulement 2U capable d’héberger 20 longues lames serveurs et la capacité brute record de 11,5 Po, à raison de 576 To sur SSD par lame. L’ensemble s’appelle Novoblade et sa promesse est de réduire à la fois l’espace occupé par dix et l’énergie consommée de 90%.

« Les besoins en capacité de stockage rapide se sont accélérés depuis l’avènement de l’IA. Et cela vient d’ordinaire avec une croissance de la puissance électrique et du volume occupé par les infrastructures. Or, ce sont des contraintes qui peuvent vite devenir rédhibitoires selon la taille des entreprises, condamnant même l’existence d’initiatives souveraines. C’est pourquoi nous nous focalisons sur cette problématique », explique Graham Gaylard, le PDG de Novodisq. LeMagIT a pu le rencontrer à l’occasion d’un événement IT Press tour consacré aux acteurs qui innovent dans l’infrastructure.

Récemment, IBM avait lui aussi annoncé pouvoir condenser un stockage de 11,8 Po dans une baie de seulement 2U. Cependant, dans son cas, il s’agit de capacité utile, à savoir 3,37 Po réels, qui contiennent des données suffisamment compressées et dédupliquées pour faire comme si sa baie offrait 11,8 Po de capacité. Dans le cas de Novodisq, il s’agit bien de 11,5 Po réels.

Un SoC AMD pour condenser toutes les fonctions La prouesse tient ici au minimalisme des cartes mères. En plus de quatre SSD NVMe QLC de 144 To chacun, chaque lame intègre une carte électronique qui se résume à un SoC Versal AI Edge 2 d’AMD et 128 Go de RAM. L’ensemble d’une telle unité consomme au maximum 60W, soit environ 1200W pour le châssis entier. Cette petite puce repose principalement sur huit cœurs Cortex-A78AE, à savoir des ARM 64 bits fonctionnant entre 1,8 et 2,2 GHz. En soi, ces cœurs offrent de quoi exécuter sur chaque lame un Linux avec un système de stockage par-dessus, éventuellement segmenté en containers (microservices). La startup évoque, en Open source, Ceph (bloc et fichiers), MinIO (objet) et même, bientôt, DAOS (clés-valeurs). Le bus vers les SSD est pour sa part constitué de 16 voies PCIe 4.0, chaque SSD communiquant classiquement sur 4 voies. La startup insiste sur le fait qu’elle a elle-même écrit la partie firmware de ses SSD, ce qui lui permettrait d’optimiser davantage la durée de vie des cellules NAND, avec un objectif de vendre des machines capables de rester dix ans en production. Selon la compréhension du MagIT, les SSD contenus dans chaque lame seraient juste des puces NAND fournies par Micron – avec un contrat qui mettrait Novodisk à l’abri des pénuries actuelles, assure la startup – et dépourvues du firmware habituel. Ce firmware, qui sert à stocker les informations dans les cellules de NAND et qui aurait été réécrit par Novodisk, serait exécuté par le SoC Versal AI Edge 2 lui-même. Cependant, l’existence d’un autre produit, le Novoforge (voir plus bas), dont la notice en ligne indique qu’il utilise des SSD traditionnels, suggère plutôt qu’il s’agit bien dans tous les cas de SSD entiers, avec leur firmware programmé par Micron, et que le firmware dont parle Novodisq serait juste un logiciel de plus haut niveau qui répartirait les données sur quatre SSD. Une sorte de RAID pour SSD en somme.

Un FPGA pour rendre le stockage intelligent Le gros intérêt de ce SoC (System-on-Chip) d’AMD est surtout qu’il contient des circuits spécialisés qui peuvent être utiles dans le cadre d’un stockage intelligent, c’est-à-dire qui applique lui-même des traitements aux données stockées sur ses SSD. On y trouve une partie FPGA de 225 000 unités logiques reprogrammables pour exécuter des traitements à façon, en lien avec 700 unités DSP (traitement du signal), deux encodeurs/décodeurs vidéo, deux contrôleurs Ethernet 50 Gbit/s et 96 unités NPU totalisant 123 TOPS (milliers de milliards d’opérations à la seconde) en précision 8 bits pour les traitements d’IA. De fait, outre servir de nœud de stockage dans un datacenter, voire de nœud de SSD pour un autre serveur de stockage, le châssis de Novodisq est aussi présenté comme un module d’enregistrement de vidéosurveillance doté d’une capacité d’interprétation des images, ou encore comme un système d’hébergement capable de standardiser, classer, étiqueter des données de recherche à la volée. Novodisq cite l’exemple de la recherche génomique, où les données de chaque génome pèseraient à elles seules 1 To. « Nous avons la volonté de commercialiser trois produits : une version de notre châssis pour les baies rack des datacenters, une autre qui pourra fonctionner de manière autonome dans les bureaux et une troisième qui pourra être déployée sur un site de production, en Edge, au pied d’un équipement télécom, par exemple », indique le PDG. Il insiste sur l’intérêt souverain de pouvoir effectuer des traitements en local, avec une infrastructure adaptée aux contraintes énergétiques et physiques locales. Le châssis, quant à lui, assure, en interne, le routage des informations entre les lames, à raison de 50 Gbit/s entre deux lames, et, en externe, les communications vers le reste du réseau via 8 ports QSFP56. Ceux-ci peuvent aussi bien servir de connecteurs Ethernet qu’Infiniband. D’un point de vue logique, le châssis sépare les lames en deux blocs de dix unités, ce qui permet de basculer en mode haute disponibilité avec un bloc redondant de l’autre.