Avec PanFS 8, Panasas refond son offre de stockage parallèle à hautes performances

Panasas a récemment annoncé la version 8 de son système de fichiers parallèle PanFS 8 et devrait le déployer sur une nouvelle génération de systèmes de stockage plus ouverts et plus performants dans le courant du premier semestre 2019.

Panasas, un spécialiste américain du stockage à hautes performances, a récemment profité du salon SuperComputing pour dévoiler une nouvelle génération de baies de stockage ainsi que la version 8 de son système de fichiers parallèle PanFS.

Panasas est un acteur historique du stockage pour le monde du HPC. La firme, que LeMagIT a rencontrée cette semaine lors d’un tour de start-ups dans la Silicon Valley, est détenue par des fonds privés et entend avec ces nouveautés affronter de façon plus frontale des acteurs comme DDN et IBM, respectivement connus pour leurs systèmes de fichiers Lustre et Spectrum Scale — ex GPFS.

L’architecture de stockage de Panasas sépare historiquement la couche de contrôle de la couche de stockage. La première est gérée par des « directeurs » assurant notamment le stockage des métadonnées. La seconde est délivrée par des nœuds hybrides embarquant un mix de SSD et de disques durs. Panasas dispose de son propre système de fichiers parallèle, baptisé DirectFlow, mais ses systèmes sont aussi accessibles via NFS ou SMB. Selon le constructeur, plus de 90 % des clients utilisent DirectFlow du fait de ses bénéfices en matière de performance.

Principe de fonctionnement de DirectFlow

Dans la version actuelle de la solution de Panasas, récemment rebaptisée ActiveStor Prime, les nœuds de stockage sont des lames, insérées dans un châssis 4U (11 lames par châssis 4U). Dans la prochaine itération des systèmes du constructeur, l’ActiveStor Ultra - attendue à la mi-2019 —, le stockage sera délivré par des serveurs de 4U, chacun hébergeant 4 nœuds (demi-largeur et demi-hauteur) avec six emplacements pour disques durs et 2 emplacements pour SSD.

En abandonnant son format lame propriétaire et en basculant vers un format de serveurs standard (des SuperServer « Fat Twin » de SuperMicro) poru ses nœuds de stockage, le constructeur entend abaisser les coûts de sa solution et basculer vers un modèle de type « Software Defined ». Comme l’explique Jim Donovan, le directeur marketing de la firme, ce choix pourrait à terme ouvrir la porte au support de nœuds délivrés par des tiers tels que des nœuds de stockage Dell ou HPE.

Une performance multiplée par cinq

Selon la firme, le lancement de PanFS 8 et de l’ActiveStor Ultra devrait permettre non seulement d’abaisser les prix des solutions du constructeur (d’environ 30 % à capacité similaire), mais aussi de doper les performances.

L'ActiveStor Ultra

Jim Donovan indique ainsi que la performance en crête de l’ActiveStor Ultra devrait être environ six fois meilleure (en termes de bande passante) que celle de l’ActiveStor Prime. Cet accroissement de la performance s’explique en partie par la réécriture de PanFS mais aussi par l’utilisation de SSD NVMe pour le stockage des métadonnées et par l’utilisation d’un tiers à base de SSD SATA sur les nœuds de stockage. Cette couche de stockage SSD permet notamment de doper la performance pour le stockage de petits fichiers. Les données plus volumineuses continuent quant à elle à être streamées directement sur un étage de disques durs.

Chaque châssis 4U ActiveStor Ultra permettra ainsi de stocker entre 96 à 448 To de données sur disques durs, et jusqu’à 32 To sur SSD SATA — un étage local de SSD NVMe délivré par une carte M.2 est aussi présent. Il pourra être accédé nativement via une connectique Infiniband (EDR ou FDR), OmniPath ou Ethernet (25 Gbit/s).

Selon Panasas, chaque châssis ActiveStor Ultra de 4U sera capable de délivrer 7,5 Go/s de bande passante (contre 1,5 Go/s pour le précédent châssis lame 4U). Il faudra un minimum de 3 châssis ActiveStor Ultra pour mettre en œuvre un cluster — le mécanisme de distribution de données de Panasas nécessitant au moins dix nœuds de stockage —, une configuration à laquelle s’ajoute obligatoirement la mise en œuvre d’un contrôleur (en fait un châssis 2U Intel incorporant 4 nœuds directeurs). La performance et la capacité d’un cluster Panasas évoluent ensuite quasiment linéairement avec l’ajout de nœuds de stockage additionnels.

Pour se différencier des autres solutions à base de systèmes de fichiers parallèles, notamment celles s’appuyant sur Lustre, BeeGFS ou Spectrum Scale, Panasas mise notamment sur la simplicité de mise en œuvre et d’administration de sa solution. Comme l’explique Praneetha Manthravadi, la responsable produits du constructeur, le fonctionnement d’un cluster Panasas est très largement automatisé et ne nécessite par un tuning spécifique.

Des opérations comme l’ajout de nœuds additionnels s’effectuent de façon transparente, le cluster détectant automatiquement l’ajout de nouveaux nœuds et assurant la redistribution automatique des données. Le scrubbing de données (afin de prévenir la corruption silencieuse de données) ou la redistribution des données en cas de défaillance d’un nœud ou d’un disque sont aussi automatisés. 

Pour approfondir sur HPC

Close