L’ère des très grands NAS
Et avec votre NAS, vous prendrez bien quelques péta-octets ? La question aurait sans doute été saugrenue il y a encore trois ans dans bien des entreprises. Mais pour certains géants de l’Internet comme pour nombre de grandes entreprises et administrations, la perspective de devoir stocker durablement plusieurs péta-octets de données dans les années à venir n’est plus irréaliste. La situation est similaire sur certains marchés HPC où les volumes de données générés par les expérimentations atteignent des niveaux jusqu’alors inconnus, à l’exemple du LHC au CERN.
Jusqu’alors, la seule solution trouvée par les entreprises s'est limitée à multiplier les îlots de serveurs NAS et il n’est pas rare, dans certains grands comptes, de trouver des dizaines, voire des centaines de NAS autonomes. Problème : aucun de ces NAS n’a été conçu pour être intégré avec les autres au sein d’un espace de stockage unifié, d’où un vrai casse-tête d’administration et une explosion des coûts de gestion de ces serveurs NAS.
Virtualiser les NAS : fausse bonne idée ou solution de transition ?
Dans un premier temps, les constructeurs ont espéré résoudre ce problème en misant sur les appliances de virtualisation de NAS. L’idée de base était intéressante : il s’agissait d’insérer une ou plusieurs appliances en frontal des multiples serveurs NAS afin de les intégrer dans un espace de nomage global (Global NameSpace), mais aussi faciliter au passage les migrations et déplacements de données entre ilôts autrefois disparates. Séduit par le concept, EMC a ainsi racheté Rainfinity, tandis que Brocade mettait la main sur NuView pour créer StorageX. F5 Networks a, de son côté, acquis Acopia et créé la gamme ARX, tandis que Cisco s’emparait de NeoPath Networks.
Tous ces rachats, effectués entre 2005 et 2007, n’ont toutefois pas connu le succès espéré, en partie du fait du coût de ces solutions, mais aussi de la complexité de leur mise en œuvre et de leur administration à grande échelle. Et ce malgré des bénéfices indéniables en matière de réplication, de migration de données (notamment entre de multiples niveaux de NAS différents) et de simplification des namespace pour les utilisateurs finaux.
Cisco a ainsi tué très rapidement le File Director de Neopath, tandis que Brocade a stoppé la commercialisation de StorageX. Rainfinity est quant à lui toujours proposé en consolidation de NAS Celerra par EMC, tandis que les ARX de F5 poursuivent leur chemin.
Reste que l’espoir placé dans ces solutions pour aider à la consolidation des NAS semble s’être estompé et que, désormais, l’intérêt pour ces appliances se porte plutôt sur leurs fonctions de migration de données.
Les constructeurs investissent dans les architectures de NAS en cluster
Pour faire face aux besoins massifs de stockage de données non structurées des entreprises, la nouvelle mode semble plutôt être à la réalisation d’appliances NAS de grande capacité s’appuyant sur des technologies de cluster. Ces architectures présentent l’avantage de permettre l’utilisation de composants banalisés - dans la pratique des serveurs x86 bourrés de disques ou reliés à de simples piles de disques (ou JBOD) - pour assembler des systèmes NAS de grande capacité à des prix au Go défiant toute concurrence. Un autre avantage est leur évolutivité. Si l’on désire plus de performances ou de capacité, il suffit de rajouter des nœuds au cluster. Chaque serveur additionnel adjoint au cluster lui ajoute en effet de nouveaux ports d’entrée/sorties, ainsi qu’une capacité additionnelle. En général capacité et performances augmentent plus ou moins linéairement avec le nombre de nœuds dans le cluster - la linéarité dépendant notamment du type de systèmes, de l’efficacité du logiciel et du type de connexions utilisées au sein du cluster.
Isilon et Panasas : les arguments des pionniers
L’un des premiers constructeurs à s’intéresser au concept a été HP, qui a acquis PolyServe en février 2007 et en a fait le cœur de sa baie StorageWorks 9100 Extreme Data Storage, un système NAS en cluster d’une capacité de plus de 600 To (qui devrait sans doute passer à 1,2 To avec l’arrivée des disques SATA de 2 Go). La baie est en fait un cluster NAS (NFS et HTTP) de 16 serveurs sous Linux bourrés de disques et faisant tourner le système de fichier clusterisé de PolyServe. Pour aussi imposant que paraisse cette baie, elle fait pâle figure face aux solutions en cluster d’Isilon et Panasas, les deux pionniers du secteur.
Isilon peut ainsi agréger jusqu’à 5,2 péta-octets (Po) au sein d’un seul et même système de gestion de fichiers réparti sur 144 noeuds en cluster InfiniBand. Ces nœuds peuvent, qui plus est, avoir des caractéristiques différentes en matière de performances et de capacité afin de permettre la mise en œuvre de politiques de qualité de service différenciées. Panasas, de son côté, cible plutôt le marché du HPC, et sa solution n’a pas vraiment de limite en matière de capacité ou de performances.
Téléchargez cet article au format PDF












