Nmedia - Fotolia

Le stockage NAS de Weka devient multicloud

La version 4 du Weka permet désormais d’étendre la capacité d’un seul NAS aux différents services de stockage d’AWS, Azure, GCP et OCI, tout en optimisant les coûts et les performances.

Weka, l’éditeur d’un système NAS éponyme qui a la particularité de fonctionner à cheval entre un datacenter et le cloud, lance la version 4 de son produit. La caractéristique la plus saillante de cette V4 est que le système est désormais multicloud. Il ne fonctionnait auparavant que dans AWS ; il est désormais possible de faire glisser ses fichiers dans Azure, GCP et OCI, les clouds publics de Microsoft, Google et Oracle.

« L’avantage principal de pouvoir ainsi passer d’un cloud à l’autre est de stocker vos données chez le fournisseur le plus avantageux pour vous, tout en pouvant les utiliser chez celui qui offre les services de Machine learning et d’IA dont vous avez besoin », explique Nilesh Patel, le responsable des produits chez Weka, lors d’une rencontre avec le MagIT.

« Sans Weka, vous souffririez d’effets de coutures, qui vont de la difficulté à convertir les données entre les clouds au coût élevé que peut avoir l’extraction de ces données depuis un service », ajoute-t-il.

En l’occurrence, Weka a la faculté de présenter aux utilisateurs et aux applications toujours le même NAS, tout en plaçant les fichiers soit sur des services de stockage objet peu chers, soit sur des instances avec du stockage bloc très rapide.

Son système – initialement appelé Matrix, désormais plutôt dénommé Data Platform, mais que tout le monde appelle Weka tout court – serait capable de ménager du tiering parmi le stockage, en reconnaissant si une infrastructure possède des SSD NVMe (très rapides), des SSD QLC (les moins chers), mais aussi une connectique réseau 100 Gbit/s (transferts à la vitesse maximale).  

Fragmenter les fichiers en cloud pour optimiser leur accès et leur coût

La force de Weka est surtout de disposer d’une multitude de connecteurs pour optimiser encore plus la lecture et l’écriture des fichiers. Il s’interface ainsi avec le système de stockage GPUDirect Storage de Nvidia sur les clusters de calcul équipés de GPU, ou encore avec les clusters de containers Kubernetes via un pilote CSI dédié. Concernant les services de stockage classiques, Weka peut partager ses contenus en NFS, désormais jusqu’au protocole v4.1, en SMB, avec même une déclinaison maison SMB-W qui accélère l’accès aux petits fichiers, ou encore en S3.

« À titre d’exemple, il devient possible d’extraire des données archivées dans S3 Glacier en quelques millisecondes à peine. »
Nilesh PatelResponsable des produits, Weka

« Nous avons ajouté dans la v4 de Weka un nouveau processus de réduction de données qui permet de déplacer très rapidement les informations d’un support à l’autre et qui réduit drastiquement la capacité de stockage que vous consommez. Et cela concerne les fichiers, mais aussi leurs métadonnées et les snapshots qui correspondent à une image à un moment donné de vos disques. À titre d’exemple, il devient possible d’extraire des données archivées dans S3 Glacier en quelques millisecondes à peine », argumente Nilesh Patel.

Le service d’archivage S3 Glacier est réputé le moins cher des services de stockage d’AWS mais aussi le plus lent. Pour que Weka parvienne à en extraire des données en quelques millisecondes au lieu des minutes habituelles, il y a nécessairement une ruse. Nilesh Patel explique que Weka récupère en l’occurrence les données archivées depuis des fragments qui ne sont pas tous stockés dans S3 Glacier. En fait, il y aurait la hiérarchie de répertoires que voit l’utilisateur et une hiérarchie de répertoire différente, invisible, qui sert à Weka pour organiser ses données du mieux possible.

Concernant les prix, non divulgués lors de cet entretien, il s’agira d’acheter du stockage Weka à la souscription. Cette souscription doit englober les coûts du stockage chez les fournisseurs de cloud.

Pour mémoire, Weka est le système NAS qu’utilise Hitachi Vantara pour ses HNAS, des passerelles qui servent à partager sur le réseau le contenu de ses baies de disques VSP et qui leur permettent aussi d’étendre leur capacité en cloud public.

Pour approfondir sur Stockage en Cloud

Close