Stockage NAS en cluster : Etat de l'offre sur le marché

Avec l'accroissement exponentiel des besoins en capacité de stockage, déplus en plus d'entreprises s'intéressent aux systèmes de stockage NAS en cluster qui promettent simplicité d'administration et extension facile des capacités de stockage. Nos confrères de SearchStorage.com font un tour d'horizon rapide avec LeMagIT sur l'offre actuellement disponible sur le marché.

Dans le monde du stockage, les systèmes de stockage distribués (ou scale-out) sont une option de plus en plus populaire pour faire face à la croissance rapide des données. Les besoins de stockage de fichiers non structurés sont aujourd’hui ceux qui progressent le plus vite, ce qui fait des systèmes NAS en cluster les systèmes de stockage distribués les plus populaires. Ces systèmes sont particulièrement adaptés au stockage de grands jeux de données non structurées, mais aussi au stockage d’informations multimédias de grande taille (images, vidéos…). Ils sont aussi de plus en plus utilisés pour les applications analytiques à grande échelle dites Big Data (par exemple, Hadoop repose sur un système de fichiers distribué baptisé HDFS).

Les constructeurs n’ont pas forcément les mêmes vues en matière d’architecture de systèmes de stockage en cluster mais cela ne les a pas empêchés d’avancer sur le sujet. La plupart des baies de stockage distribuées s’appuient sur des nœuds serveurs, qui ressemblent à s’y méprendre à des serveurs banalisés et mettent en œuvre des interconnexions standards (Gigabit Ethernet ou Infiniband). Ces serveurs sont agglomérés en un système de stockage cohérent par un système de gestion de fichiers (filesystem) plus ou moins propriétaire. Des constructeurs comme Dell, EMC, Hewlett Packard, Hitachi Data Systems et NetApp ont acquis la technologie pour commercialiser leur propre système Scale-out NAS. IBM a développé sa propre technologie (SONAS), mais revend aussi en OEM les baies de NetApp. D’autres constructeurs comme DDN, Panasas ou Quantum oeuvrent aussi sur ce marché. Et c’est sans compter sur une multitude de solutions logicielles libres ou propriétaires.

Le marché du NAS distribué, né dans les environnements de calcul, a parcouru un long chemin depuis ses débuts et les systèmes proposés aujourd’hui incluent la plupart des fonctions qu’attendent les entreprises en matière de provisionning, de performance, de protection des données…

Cet article fait un inventaire rapide des principales solutions aujourd’hui disponibles sur le marché.

Où l’on retrouve les suspects habituels…

EMC est certainement celui qui a fait l’entrée la plus remarquée sur le marché du Scale-out NAS avec l’acquisition pour 2,25 milliards de dollars d’Isilon en novembre 2010. Basé à Seattle, Isilon était alors vu par beaucoup comme le leader d’un marché très éclaté. Comme nombre de ses concurrents, EMC a préféré en passer par une acquisition pour se développer rapidement sur le marché du NAS distribué. Une façon aussi pour le géant de tenter de prendre en tenaille son concurrent NetApp entre ses baies VNX et les baies Isilon.

«Les clients veulent pouvoir faire évoluer leur environnement de stockage d'une manière très simple. Ils ne veulent pas de la complexité dans ces architectures", explique Nick Kirsch, le directeur produit Isilon chez EMC. Selon lui, Isilon a d’emblée conçu son système pour faire du scale-out lorsque d’autres ont greffé des couches de scale-out sur un système de fichiers traditionnel (une allusion à NetApp qui a choisi d'intégrer le filesystem en cluster issu du rachat de Spinnaker à son OS Data OnTap, NDLR).

Justement le mode cluster des baies NetApp, est le fruit du rachat en février 2004 des technologies de stockage en cluster de Spinnaker Networks. Alors qu’EMC a acquis une ligne complète de produits, NetApp a acheté Spinnaker pour sa propriété intellectuelle. L’objectif était d’intégrer la technologie Spinnaker dans Data ONTAP, le système d’exploitation des baies NetApp, afin de leur ajouter des capacités de stockage en cluster. NetApp a commencé à offrir des configurations en cluster en 2007 avec une version spécialisée de son OS, baptisé Data Ontap GX. Mais ce n’est qu’avec la version 8 de son OS que le constructeur a commencé à fusionner les deux personnalités (NAS standard et Cluster) de son OS. L’idée à terme est que les baies NetApp n’auront plus qu’un seul mode unifié et que les clients pourront configurer leurs baies NetApp de telle façon que l’ajout d’une nouvelle baie dans le datacenter sera considéré comme un ajout d’un nœud à un cluster et viendra renforcer les capacités des baies existantes.

Hitachi Data Systems, le dernier des trois grands spécialistes du stockage, s’est longtemps appuyé sur le savoir faire de son partenaire BlueArc en matière de scale-out NAS, avant de le racheter en septembre 2011. Le système de gestion de fichiers en cluster SiliconFS des baies BlueArc sait gérer jusqu’à 16 Po de capacité et supporte jusqu’à 4 millions d'objets par répertoire. La ligne d’appliances Titan vise les marchés du stockage à hautes performances (elle a par exemple été retenue par le Synchrotron de Barcelone) , tandis que la ligne de Mercury est plus adaptée à des besoins « mid-market ».

Les constructeurs généralistes se joignent à la bataille

Outre les deux grands spécialistes du stockage, les constructeurs généralistes s’agitent aussi sur le marché du stockage en cluster. Dell a ainsi acquis ses technologies scale-out en mettant la main à bon compte sur les actifs de Exanet en février 2010. Depuis le constructeur a rebaptisé Dell Scalable Filesystem ce qui était autrefois le système de gestion de fichiers en cluster d’Exanet. Dell a aussi commencé à l’intégrer à ses différentes lignes de produits, comme la passerelle NAS Dell Powervault NX3500 ou la Baie Dell Equallogic 7 500 (qui outre sa partie Equallogic, inclut deux nœuds en cluster « Exanet »). Le constructeur texan a aussi annoncé qu’une intégration similaire serait réalisée avec la prochaine génération de baies Compellent.

Chez HP, le rachat de PolyServe et celui d’Ibrix (qui s’est traduit par la mise au placard des technologies PolyServe), ont permis au constructeur de développer la gamme StorageWorks X9000, qui permet de stocker jusqu’à 16 Po de données. Avant son rachat, Ibrix était un filesystem en cluster populaire dans le monde du calcul et des médias. HP l’intègre désormais dans des racks préconfigurés avec des serveurs banalisés bourrés de disques. Des configurations prêtes à l’emploi qui constituent la gamme StorageWorks X9000.

IBM développe depuis 2008 son propre système de stockage en cluster baptisé SONAS (Scale-Out NAS). SONAS s’appuie notamment sur le filesystem en cluster GPFS (General Parallel Filesystem) qu’il a développé pour le monde du calcul. Le marché visé par SONAS (qui sait gérer jusqu’à 21 Po de données) est celui des grands fournisseurs Internet et des entreprises. Il est à noter que du fait du caractère très technique de GPFS, SONAS a fait ses débuts comme une offre sur-mesure appuyée par IBM Global Services. Mais au fil du temps, l’offre s’est de plus en plus packagée au point d’être aujourd’hui disponible sous la forme d’appliances préconfigurées.

Notons aussi l’offre de Huawei, héritée du rachat par le constructeur chinois de sa co-entreprise avec Symatec, Huawei-Symantec. Les baies de stockage NAS en cluster OceanSpace N se présentent sous la forme d’un cluster de contrôleurs NAS placé en frontal de baies de stockage OceanSpace S. Un cluster OceanSpace N8500 à 8 nœuds a obtenu un score de 636 000 IOPS au test de performance NFS SPECsfs, ce qui en fait l'un des systèmes les plus performants à ce benchmark, juste derrière les versions cluster du FAS 6240 et derrière un cluster Isilon S200. Ses résultats sont d'autant plus impressionnants que le test ne fait aucun usage de stockage Flash contrairement à ses deux concurrents.

Les petits constructeurs et les nouveaux venus ciblent les marchés verticaux

Aux côtés des géants du stockage, certains constructeurs de taille plus modeste se concentrent sur des segments verticaux aux besoins plus ciblés comme le monde de la recherche et du calcul haute performance (HPC), le monde de la recherche géo-sismique (pétrole et gaz), celui des médias…

Panasas a par exemple conçu son système de stockage parallèle ActiveStor pour les environnements informatiques dédiés aux marchés de la recherche, de l'énergie, de la finance, de la fabrication… Son architecture s’appuie sur un système de châssis de lames 4U capable de mixer jusqu’à 11 lames de stockage et de lames de contrôle (« Director Blades »). Chaque châssis stocke jusqu’à 60 To et affiche un débit plafond de 1,5 Go/s en lecture. En interconnectant de multiples châssis via des connexions 10Gigabit Ethernet, on peut élaborer un système capable de stocker jusqu’à 6 Po et capable de délivrer des débits de transfert pouvant atteindre 150 Go/s.

DataDirect Networks (DDN) cible quant à lui les marchés de l’industrie des médias, du cloud et du calcul avec ses systèmes GridScaler et ExaScaler. Il a aussi lancé en avril 2011 la plate-forme en cluster « NAS Scaler », qui permet d’agréger jusqu’à 16 nœuds dans un pool de capacité unique de 2 Po. Le tout avec des fonctions avancées de protection de données, de hiérarchisation automatique des données…

Quantum qui, jusqu’à l’an passé, se contentait de revendre son système de gestion de fichiers en cluster StorNext à des constructeurs et intégrateurs (dont DDN) s’est aussi lancé sur le marché du matériel à la fin 2011, avec l’annonce des systèmes de stockage StorNext. L’objectif du constructeur est de cibler en direct le marché des médias, du HPC et de l’énergie. Les appliances StorNext Série Q offrent des capacités allant de 7,2 To à plus de 1 Po de capacité brute selon le nombre de nœuds. Elles sont épaulées par une offre d’archivage sur bande pour l’archivage à long terme de contenus.

Enfin, notons l’arrivée sur le marché de Red Hat, avec son appliance de stockage SSA qui s’appuie sur le système de fichiers en cluster glusterfs acquis avec le rachat de Gluster en octobre 2011. Le SSA est en fait un système d’exploitation RHEL incluant glusterfs que l’on peut déployer sur des serveurs banalisés bourrés de disques pour constituer un système de stockage en cluster.

Adapté d'un article en anglais de Todd Erickson, SearchStorage.com, enrichi par Christophe Bardy, LeMagIT.fr

A lire aussi sur LeMagIT :

 

Pour approfondir sur SAN et NAS

Close