Vast Data devient le fournisseur de stockage à la croissance la plus rapide
Vast Data n’existe sur le marché du stockage que depuis 2019. Mais les entreprises lui signent déjà des chèques en millions de dollars pour lui acheter ses baies Flash multi-usages.
Vast Data serait devenu le fournisseur de stockage dont la carrière commerciale a le plus rapidement décollé, selon son dernier communiqué. « Alors que nous n’avons commencé à commercialiser nos solutions qu’en février 2019, nous venons de boucler notre année fiscale avec un chiffre d’affaires 3,5 fois supérieur à celui de l’année dernière ! Nous signons tout juste notre troisième commande de plus de 10 millions de dollars ! Pure Storage a dû attendre deux ans avant de parvenir à faire des ventes à ce niveau ! » exulte Jeff Denworth, le co-fondateur de Vast Data. leMagIT a pu le rencontrer lors de l’IT Press Tour, un événement qui présente aux journalistes les nouvelles pépites en matière de stockage.
Le succès de Vast Data a surtout ceci d’étonnant que le marché ne croyait pas à son produit. Contre toute habitude, le fournisseur propose en effet une baie de stockage bardée de SSD bien plus rapides que les disques durs, modèles Intel Optane très haut de gamme compris, pour… archiver les données froides.
« Hé bien oui ! Quand vous utilisez des SSD pour tous vos usages, vos applications décollent ! Et vous n’avez même plus à perdre votre temps à administrer des silos de stockage puisque toutes les données sont servies de la même manière : nous revendiquons de vendre des équipements de tier-1 [classe de stockage des applications hautement performantes, N.D.R.] pour faire du tier-5 », lance le cofondateur.
Cibler les entreprises qui achètent… pour 1 M$ de matériel
« Mais n’allez pas croire que nous vendons des solutions démesurées : pour le prix que vous facturent nos concurrents, notre solution vous apportera cinq à dix fois plus de SSD qu’ils ne vous en proposent », assène-t-il.
Dans les faits, la famille de baies de stockage de Vast Data, baptisée Universal Storage, ne sert jamais uniquement à entreposer des archives. « Tous les cas d’usage du stockage sont possibles. L’idée est que nos clients ont des archives vivantes : ce sont des sauvegardes très lourdes qu’ils doivent pouvoir restaurer rapidement, des lacs de données qui, plutôt que dormir, sont analysés par des applications d’analytique ou des algorithmes d’intelligence artificielle. Or, pour exécuter ces dernières rapidement, grâce à un stockage rapide, présente un avantage concurrentiel très important pour les entreprises. »
Le détail sur lequel Jeff Denworth ne s’attarde pas beaucoup non plus est que les clients de Vast Data ne sont justement pas des entreprises comme les autres. On y trouve principalement des banques, des centres de recherche, de grands hébergeurs de cloud privé. « Ce sont en effet de très grosses structures, pour lesquelles il est normal de commander à un fournisseur pour un million de dollars d’équipements », concède-t-il au détour d’une phrase.
En réalité, le créneau de Vast Data est de proposer des solutions très haut de gamme à un prix cassé. Si cassé que l’on pourrait croire que les baies sont destinées à des usages aussi accessoires que l’archivage, donc.
Marier QLC et Optane
La particularité technique des baies SAN/NAS de Vast Data est qu’elles se composent de SSD à NAND QLC, moins chère que les unités Flash, et que tous leurs défauts sont compensés par une poignée de SSD Optane dans chaque boîtier.
« Les SSD QLC offrent bien plus de capacité que les autres SSD au même prix. En revanche, ils ont deux problèmes : ils vieillissent bien plus vite et la taille de leurs secteurs logiques est 1 Mo, contre 4 Ko sur les disques ordinaires. Éviter d’abîmer prématurément les cellules et réunir plusieurs petits fichiers, pour ne pas qu’ils gâchent chacun de la capacité, est le rôle des très rapides SSD Optane d’Intel. Ils agissent dans nos baies comme des caches intelligents », dit Jeff Denworth.
Pour le reste, les baies Universal Storage fonctionnent en cluster, que ce soit en NFS pour partager des documents, en mode NAS avec les utilisateurs et les applications, ou comme en NVMe/RoCE pour synchroniser leurs accès en mode bloc.
« Dans les centres de recherche, nous succédons aux systèmes de fichiers parallélisés, comme GPFS. Ces systèmes sont utilisés à côté de clusters contenant une grande quantité de nœuds pour traiter sans cesse de nouvelles données, ce qu’un NAS ordinaire ne sait pas faire. En revanche, les systèmes de fichiers parallélisés ont le défaut d’être très compliqués à maintenir. Notre solution réunit le meilleur des deux mondes : l’administration est aussi simple que sur un NAS, car nous n’avons pas de mécanisme d’éclatement des données entre les nœuds, mais cela reste un cluster, car les Optane répartissent les accès. »
Repenser l’erasure coding et la réduction de données
Vast Data explique d’ailleurs que sa solution n’emploie pas les techniques classiques d’erasure coding (qui nécessite d’avoir deux répliques de chaque donnée éparpillées sur le cluster de stockage) ou de déduplication.
« Nous avons des fonctions équivalentes, mais les nôtres reposent sur des algorithmes qui travaillent globalement sur tout le cluster, plutôt qu’au niveau de chaque bloc de données. Par exemple, pour réduire la taille des données, nous ne cherchons pas à éliminer tous les doublons, nous attribuons des codes aux séquences de données qui se ressemblent et qui intègrent le plus souvent plusieurs blocs. », explique Jeff Denworth.
Jeff DenworthCo-fondateur de Vast Data
Selon des tests partagés par le fournisseur, sa solution permettrait de réduire la taille des sauvegardes par 20 quand elle est utilisée conjointement avec celle de l’éditeur de backup Rubrik, qui dispose lui-même d’une fonction de déduplication sachant, en moyenne, diviser par 5 l’espace occupé par des informations. Dans le cas des centres de recherche, une baie Universal Storage diviserait la taille des données en cours de traitement par deux ou trois, alors que, dans ce cas d’usage, la déduplication est majoritairement inefficace.
« Au final, notre solution de stockage est 90 % plus rapide que le système de fichiers GPFS dans les centres de calcul. Nous sommes aussi 25 % moins cher à capacité équivalentes », argumente Jeff Denworth.
Bientôt No 1 du stockage ?
Vast Data a désormais l’intention d’être ni plus ni moins que le No 1 des fournisseurs de stockage en termes de chiffres d’affaires. Dans ses cartons, il y aura certainement cette année l’annonce de fonctions cloud et la déclinaison des Universal Storage au format Edge. Jeff Denworth laissant entendre qu’il pourrait d’ailleurs s’agir du même produit, LeMagIT en conclut qu’il s’agira sans doute d’une version de l’Universal Storage compatible avec Kubernetes.
Dans l’immédiat, Vast Data vient surtout de passer un accord avec Nvidia pour conjuguer l’Uniserval Storage avec son serveur de calcul GPU, le DGX-1100. En l’occurrence, le système de stockage a été réécrit pour s’exécuter uniquement sur les GPU, dans l’idée d’utiliser la configuration de Nvidia, non plus pour calculer des simulations, mais bien comme un contrôleur NAS surpuissant.
La machine résultante porte le nom commercial de LightSpeed. Selon un document interne de Vas Data, ce mariage des deux technologies permettrait de proposer un NAS avec 162 Go/s de bande passante, contre seulement 2 Go/s d’ordinaire sur un cluster qui sert des algorithmes d’intelligence artificielle. Vast Data a refusé de communiquer les noms des entreprises chez qui ces situations ont été mesurées.