idspopd - Fotolia

Comment survivre au déluge de données non structurées ?

Cohesity répond aux lacunes des solutions NAS traditionnelles en proposant une nouvelle approche du stockage secondaire.

Pendant des années, les grandes entreprises ont hébergé des fichiers et des objets sur des plates-formes NAS dédiées, en utilisant les dernières technologies de fournisseurs tels que NetApp et Dell EMC Isilon. Ces appliances deviennent rapidement des silos qui compliquent le partage de données et font de la gestion de l’infrastructure une entreprise herculéenne.

Nous avons besoin d’une architecture de remplacement qui offre une évolutivité, réduit le fardeau d’administration, et fasse s’infléchir la courbe capacité-demande afin de ralentir les achats de nouvelles capacités de stockage, mais aussi d’améliorer la performance et la productivité. C’est par exemple l’un des objectifs que s’est fixés Cohesity la dernière start-up de Mohit Aron (cofondateur de Nutanix) avec son stockage secondaire hyperconvergé.

Le problème avec le NAS

Les volumes de données ont augmenté à un rythme accéléré au cours des dernières années et devraient continuer à le faire dans un avenir prévisible. Les données non structurées, qu’il s’agisse de fichiers ou d’objets, contribuent de manière significative à cette croissance et sont généralement stockées sur des NAS ou des serveurs de fichiers en silos.

L’évolutivité de ces plates-formes reste souvent limitée. Un NAS n’est pour l’essentiel qu’un contrôleur connecté à des tiroirs de disques. Ce contrôleur est généralement équipé d’un cache coûteux afin de réduire la latence des opérations d’écriture. Une fois que tous les disques sont remplis, le seul choix est de déployer de nouveaux contrôleurs (et de nouveaux tiroirs) et de multiplier ainsi les systèmes pour faire face à la croissance de données. Des logiciels spécialisés peuvent alors être nécessaires pour établir et maintenir un espace de noms global afin que vous puissiez voir les fichiers d’une manière unifiée.

Il y a de nombreuses lacunes dans cette stratégie, et plusieurs façons de mettre en défaut le stockage, du fait d’espaces de noms corrompus, de pannes de matériel, etc. Le modèle de coût peut aussi croître de façon imprévisible, en raison des différences dans l’architecture de stockage, la topologie et les protocoles au fil du temps.

Une architecture alternative

Cohesity est né d’un effort pour résoudre certains des problèmes liés au backup, explique Mohit Aron, le PDG de la société. L’objectif était de créer une plate-forme de stockage secondaire qui pourrait supporter une capacité de stockage de type webscale - à la fois « on premises » et dans le cloud - sans nécessiter beaucoup d’administration.

Fan de la déduplication, Aron voulait également que sa plate-forme de stockage secondaire incorpore cette fonctionnalité et bien d’autres plutôt que de devoir reposer sur des capacités délivrées par des logiciels ou des plates-formes tierces.

Aron est un vétéran de Nutanix, qui a eu une démarche similaire pour le stockage primaire, en utilisant une technologie de stockage définie par logiciel et une infrastructure hyperconvergée pour héberger les charges de travail critiques. En tant que développeur du système de fichiers Google, Aron avait le savoir-faire requis pour créer la plate-forme de stockage secondaire hyperconvergée de Cohesity.

La firme vante les mérites du stockage secondaire hyperconvergé pour diverses applications, y compris le stockage de fichiers et d’objets. Et la plate-forme semble être une amélioration par rapport aux NAS traditionnels sur les points suivants :

  • Hyperconvergence. La plate-forme de Cohesity est hyperconvergée, ce qui signifie que l’on a affaire à un modèle de mode de stockage distribué en grappe qui est piloté comme un pool de ressources unique. L’idée est d’héberger sur une seule plate-forme toutes les données des charges de travail de stockage secondaires qui sont habituellement fragmentées et cloisonnées dans différents modèles de NAS.
  • Webscale. Le stockage secondaire hyperconvergé de Cohesity est théoriquement évolutif à l’infini et embarque nativement la déduplication (en mode global avec un algorithme à taille de bloc variable). Il est possible de démarrer un cluster avec trois nœuds puis de faire évoluer le système par simple ajout de nœuds additionnels.
  • Productivité. Vous pouvez partager les données entre les charges de travail directement plutôt que de créer des copies de données à des fins de partage. Un index global des données stockées couplé à un moteur de recherche vous aide à trouver les données dont vous avez besoin, et les mécanismes analytiques intégrés prennent en charge les requêtes et l’analyse des tendances, tout en améliorant la capacité des différentes charges de travail à utiliser les données.
  • Multi-cloud. Le système de stockage secondaire hyperconvergé de Cohesity peut s’étendre de la bordure du centre de données à de multiples nuages publics et privés pour capitaliser sur l’élasticité et l’économie des nuages, tout en utilisant les données où qu’elles soient placées dans l’infrastructure.

Un système moderne

Cohesity est fier de son système de fichiers distribué SpanFS, et qui est à la base des fonctionnalités avancées de sa plate-forme de stockage secondaire. L’entreprise garantit la cohérence des données, ainsi qu’une évolutivité linéaire de la performance de ses systèmes. Ajoutez à cela des fonctions de protection de données par erasure coding ou réplication, et vous comprendrez que le stockage Cohesity coche toutes les cases demandées à un système moderne.

Pour ne rien gâcher, le produit est licencié en fonction de la capacité utilisée et celle-ci croît avec le nombre de nœuds. Cela permet d’éliminer les migrations habituelles lorsque l’on arrive au bout de la capacité d’un NAS traditionnel. Bref plutôt qu’une appliance traditionnelle de backup, l’approche de Cohesity vaut le coup d’œil.

Pour approfondir sur Big Data et Data lake

Close