Stockage : le cluster de plus en plus tendances en 2010
Dossier sponsorisé par NetApp |
Comme dans le monde des serveurs, les grands du stockage s’interrogent sur ce que sera l’avenir des systèmes de stockage dans les prochaines années avec une question primordiale : faut-il aller vers des architectures massivement distribuées ou se satisfaire d’une évolution des architectures actuelles des baies modulaires, qui ont peu à peu détrôné les grandes baies monolithiques.
Dans le monde des serveurs de fichiers NAS et des systèmes de gestion de contenus, la réponse semble de plus en plus évidente. Pour le NAS, des pionniers comme Exanet, Isilon, Panasas, Polyserve ou comme le français Active Circle ont ouvert la voie aux architectures massivement distribuées en permettant la constitution de gigantesques systèmes NAS raccordant parfois plusieurs centaines de noeuds chacun dotés à la fois de capacité de stockage, de capacités d’entrées/sorties et de capacité CPU. Le résultat, des systèmes dont les performances et la capacité s’accroissent avec le nombre de noeud et qui ont fait leur preuve dans des secteurs exigeants comme le calcul intensif, le stockage et la distributions de médias.
Une évolution similaire s’est produite dans l’archivage avec l’apparition de systèmes de stockage de contenus (CAS - pour Content Adressable Storage- ou Object Storage, selon le nom qu’on leur donne). Le Centera chez EMC, fruit des travaux menés dans les années 90 par FilePool) a ouvert une voie dans laquelle se sont ensuite engouffrés HP, Hitachi Data Systems (avec HCAP) et Sun (qui a toutefois fini par tuer dans l’oeuf son produit CAS Honeycomb, mais qui dispose toujours de plusieurs cartes avec Lustre, SAM-QFS et même pNFS) ainsi qu’une nouvelle génération de startups telles que Cleversafe ou Caringo (récemment retenu par Dell pour son DX6000). Tous ces systèmes ont généralement en commun le fait de distribuer et de répliquer - parfois à plusieurs exemplaires - leurs contenus entre plusieurs noeuds. En cas de perte d’un noeud, ses contenus - déjà répliqués et distribués sur d’autres noeuds - sont tout simplement rerépartis sur les noeuds survivants assurant ainsi une reconstruction souvent plus rapide qu’avec des systèmes RAID.
L'ère du NAS à grande échelle
Plus que jamais, les architectures distribuées semblent devoir s’imposer pour les NAS à grande échelle et pour le stockage de contenus. En faisant l’acquisition d’Ibrix (après avoir déjà acheté Polyserve), HP a ainsi clairement marqué son intention de faire des architectures massivement distribuées son avenir dans le NAS. IBM a fait de même en annonçant en février son offre SONAS destinée à la constitution de grands dépôts NAS assemblés à base de serveurs banalisés (côté logiciel, l’offre repose sur GPFS, le système de fichiers en cluster d’IBM et sur SOFS - Scale Out File Services - qui fournit les services de fichier en réseau au dessus des noeuds de stockage GPFS). EMC a lui aussi franchi le pas avec son offre pour les Cloud, baptisée Atmos, tandis que Dell semble lui aussi prendre la même route, même s’il n’a pas encore précisé ce qu’il entend faire de son acquisition des technologies d’Exanet.
Quoique moins radical, NetApp peut lui aussi offrir des solutions en cluster à grande échelle depuis son acquisition de Spinnaker et surtout depuis le lancement d’Ontap 8, la version de son OS qui fait converger le code historique de NetApp avec celui de Spinnaker. Mais, pour l’instant, le constructeur ne semble pas voir d’urgence à casser son modèle établi, même si Ontap 8 lui permet désormais de proposer des architectures en cluster de grande taille.
HDS s'appuie, quant à lui, sur l'offre de BlueArc pour son offre de NAS en cluster HNAS. Cette offre n'est pas vraiment batie sur des composants banalisés, mais elle a une caractéristique intéressante, celle de permettre d'agréger des stockage hétérogènes en un seul et unique namespace. Notons pour terminer ce point sur le NAS en cluster que des solutions open-source pré-assemblées commencent à faire leur chemin comme celle de Gluster.
Le SAN se met lui aussi aux clusters
Dans le monde du stockage en mode bloc, les architectures distribuées progressent elles aussi à pas rapide, même si elle ne sont pas encore le cas général. Parmi les grands, IBM est le premier a avoir souscrit à l’approche distribuée en acquérant XiV, la start-up cofondée par Moshe Yanai, connu pour avoir été le père des Symmetrix chez EMC. Comme dans le NAS en cluster, le principe est le même : chaque noeud est à la fois noeud de stockage, noeud de connexion et noeud CPU, ce qui permet d’améliorer tant la capacité que les performances à chaque ajout de noeud (le nombre maximum est en général dépendant du type d’interfaces utilisées pour connecter les noeuds). Le fait que chaque noeud dispose aussi de sa propre puissance CPU permet aussi d’envisager de confier aux noeuds de nouvelles fonctions (compression de données, déduplication...).
HP a également un pied dans le marché du SAN en cluster depuis le rachat de LeftHand Networks, de même que Dell qui permet de grouper jusqu’à 16 noeuds Equallogic P6000 dans un ensemble iSCSI unique. EMC en revanche s’est prononcé à plusieurs reprises contre les architectures distribuées pour le stockage en mode bloc et a fermement démenti tout intérêt pour ces approches lors du dernier EMC World. Il sera intéressant de voir si le constructeur tient toujours le même discours cette année. Hitachi s'est également tenu à l'écart des approches distribuées jusqu'à ce jour, et il sera donc intéressant d’observer ce que sera l'architectures des futures baies SAN du constructeur.
Notons pour terminer que les approches en cluster sont générales dans le cloud. Des start-ups telles de Zetta, mais aussi des grands noms comme Google, Yahoo ou FaceBook appuient leur stockage sur des architectures distribuées. C’est aussi le cas de l’offre de cloud de Canonical (sur base Eucalyptus) et de l’offre de Joyent.
En savoir plus :
un billet de blog du CTO de Zetta sur son architecture de stockage












