Scality lance un troisième stockage objet, pour l’IA
Avec ADI, l’éditeur français entend prouver que sa technologie est plus adaptée aux projets d’IA que les stockages en mode fichier habituels. Son système implémente des technologies de Nvidia et est épaulé par un agent particulièrement doué en maintenance prédictive.
L’éditeur Scality, déjà connu pour ses systèmes de stockage en mode objet Ring (multitiers en datacenter) et Artesca (sauvegardes), lance Autonomous Data Infrastructure, alias ADI. Ce troisième produit repose sur les mêmes bases techniques que les deux autres, mais lui se veut exceptionnellement performant pour les applications d’IA.
« La différence principale par rapport à Ring, déjà positionné comme performant, est qu’ADI utilise le protocole cuObject de Nvidia, soit l’équivalent de GPUDirect Storage, mais pour le mode objet. Cette fonctionnalité va permettre à un cluster de stockage ADI d’alimenter des GPU Nvidia avec un débit qui atteint 1 To de données par seconde », lance Jérôme Lecat, le PDG de Scality (en photo en haut de cet article). Il précise que les vitesses maximales observées sur Ring plafonnent jusque-là à 422 Go/s.
ADI inaugure aussi chez Scality l’arrivée d’un agent d’IA, baptisé Guardian, pour épauler les équipes informatiques dans l’administration des systèmes de stockage objet.
Comme les autres produits de Scality, ADI est livré sous la forme d’une appliance logicielle autonome. Elle comprend son propre système d’exploitation (ScalityOS, qui correspond à un noyau Linux et un orchestrateur Kubernetes maisons) pour exécuter ses fonctions sous la forme de containers indépendants.
Cette architecture lui donne un aspect très modulaire, qui permet de regrouper sous un même espace de données des équipements hétérogènes, comprenant des serveurs avec des SSD NVMe en frontal, des disques durs économiques pour le gros des données et même des bibliothèques de bandes pour livrer à des IA des connaissances puisées dans les archives des entreprises.
« Nous sommes capables d’évaluer pour nos clients la compatibilité d’ADI avec n’importe quelle configuration matérielle. Mais la plupart du temps, nos produits sont vendus préinstallés sur des serveurs qui se déploient en deux jours sur site. En France, nombre de partenaires proposent d’installer nos produits sur des serveurs d’OVHcloud. Cela revient deux fois moins cher que souscrire à un stockage S3 de capacité similaire chez AWS », indique Jérôme Lecat.
Éditeur français avec des clients dans 70 pays, Scality existe depuis une quinzaine d’années, mais a véritablement connu un bond de notoriété ces deux dernières années avec la vente de solutions offrant plusieurs centaines de Po de capacité. Il affiche aujourd’hui une croissance de 20% par an et devrait terminer l’année avec un CA de 100 millions de dollars.
L’enjeu de remplacer le stockage en mode fichier dans les projets d’IA
D’ordinaire, les serveurs de calcul en IA lisent (et écrivent) plutôt leurs données sur des systèmes de stockage en mode fichier, jusqu’ici plus rapides que le mode objet vendu par Scality et d’autres (Dell, HPE, MinIO, DataCore...). Scality prétend avec ADI abolir cette différence de performance. Et c’est heureux, car, pour le reste, le stockage en mode objet serait le plus adapté aux tâches d’IA.
« Même Nvidia dit au marché que l’avenir du stockage de données pour l’IA est le mode objet, car sa capacité est bien plus élastique et il apporte une finesse bien meilleure dans le réglage des droits d’accès que le mode fichier », argumente Jérôme Lecat.
Par exemple, un utilisateur peut vouloir qu’un agent d’IA ait le droit de consulter son planning, mais qu’il n’ait pas le droit de modifier ses bons de commande. Avec des données stockées en mode fichier, c’est impossible, car l’agent a soit tous les droits de lecture/écriture de l’utilisateur, soit aucun. En revanche, grâce aux métadonnées d’un stockage objet, il devient possible de combiner au cas par cas les droits d’un agent avec les droits de l’utilisateur qui le pilote.
Concernant l’élasticité, les équipements de stockage en mode fichier sont limités par la quantité maximale de disques qu’un contrôleur peut gérer pour un volume partagé. C’est un problème, car les entreprises partent pour ainsi dire de zéro avec l’IA et elles sont bien en peine de savoir dès maintenant quel système de stockage en mode fichier elles devraient acheter pour qu’il corresponde toujours à leurs besoins dans trois ans.
En mode objet, on ne prend en compte que l’accès vers une information. Cet accès peut virtuellement pointer vers une infinité de disques, situés à une infinité d’endroits, sans jamais contraindre l’évolution des ressources au fil du temps.
Implémenter des fonctions de pointe pour atteindre les meilleures vitesses
ADI et Ring seraient si bien optimisés qu’ils parviendraient à donner accès à un fichier physiquement stocké sur des disques durs en moins de 5 millisecondes, alors que ces supports rotatifs ont besoin de 7 millisecondes rien que pour parcourir une piste d’enregistrements. Mais ADI repousse encore les optimisations existantes dans Ring en implémentant des technologies propres aux serveurs de calcul en IA.
Ainsi, les protocoles cuObject et GPUDirect Storage que mentionne Jérôme Lecast se basent sur le protocole réseau Spectrum-X que Nvidia a conçu pour faire voyager les données en rafale entre les nœuds de stockage et la mémoire intégrée dans les GPU. En évitant de passer par le goulet d’étranglement des processeurs hôtes, ces protocoles permettent de communiquer des données utiles quasiment à la vitesse des cartes réseau. Scality table sur des déploiements de son système sur des serveurs équipés de cartes Ethernet en 400 Gbit/s, en attendant que les modèles en 800 Gbit/s soient suffisamment disponibles.
Parmi les fonctions implémentées dans cuObject, dont Scality dit participer au développement, il y a notamment la gestion des KV-Caches. Ce point est particulièrement important pour les hébergeurs, mais aussi pour les grandes entreprises susceptibles d’acheter une batterie de serveurs de calculs afin que de nombreux utilisateurs – ou agents automatiques – puissent travailler simultanément avec une IA.
Rappelons qu’un KV-Cache est la sauvegarde de l’historique d’une conversation entre un utilisateur (ou un agent) et une IA. On utilise des KV-Cache quand, dans un cluster de calcul, chaque nouvelle requête est distribuée vers le GPU le plus disponible et qu’il faut très rapidement charger dans sa mémoire la conversation initiée sur un autre accélérateur.
La méthode consiste à sauvegarder et restaurer des contenus mémoires bruts, soit une fenêtre de contexte remplie de tokens. Et, ce, d’une manière qui s’apparente à du stockage en mode bloc, afin de tirer le meilleur parti de la vitesse des SSD qui sont installés en frontal dans les équipements de stockage. Mixer ce processus avec ceux d’un stockage en mode objet est suffisamment nouveau pour que peu de fournisseurs l’aient déjà implémenté. Scality peut se targuer d’être parmi les premiers à le faire.
Les KV-Caches sont liés à l’inférence. Mais Scality assure qu’ADI est optimisé pour toutes les tâches de l’intelligence artificielle : entraînement, RAG, recherche et synthèse vidéo, IA agentique. Grâce à ses performances, ses métadonnées et sa conception en un seul espace de donnée unique.
Un agent d’IA pour une maintenance plus prédictive que d’ordinaire
L’autre apport d’ADI est qu’il est lui-même piloté par un agent d’IA, baptisé Guardian. Celui-ci aide l’administrateur à maintenir le système en opération. Il récupère les données en cas de défaillance d’un disque, configure tout ce qu’il faut quand on ajoute de nouveaux équipements à l’espace de données, déplace des données selon des usages pour s’efforcer d’obtenir à chaque fois le meilleur équilibrage entre performances et consommation électrique.
Guardian devrait aussi à terme être capable d’identifier des comportements malveillants, de sorte à contribuer encore plus à la sécurité du système.
Scality dit avoir mis au point Guardian avec les chercheurs de l’INRIA pour aller au-delà de ce qui est aujourd’hui faisable en matière de maintenance prédictive : « les systèmes de maintenance prédictive actuels produisent beaucoup trop de faux positifs. Guardian a été conçu pour corriger ces faux positifs. Cependant, nous préférons pour l’heure qu’un humain valide chacune de ses propositions, pour garantir une fiabilité optimale », précise Jérôme Lecat.
Guardian n’embarque pas lui-même de moteur d’IA. Il communique avec des services de LLM en cloud, principalement ceux de Mistral, pour produire des analyses. Sa fonction est plutôt de savoir où prélever des informations, d’apporter à la réflexion de l’IA les connaissances de Scality en matière de support et de savoir comment actionner des opérations de maintenance dans ADI.
« L’utilisateur n’a pas à payer pour les services d’IA que Guardian utilise ; tout est compris dans le prix. Cela dit, nous allons d’ici à l’année prochaine permettre à Guardian d’utiliser des LLM installés sur site », indique Jérôme Lecat.
L’agent dispose par ailleurs d’un nombre grandissant de connecteurs pour travailler avec les autres environnements de l’utilisateur. À l’heure actuelle, il est déjà capable de piloter et d’interroger les métriques des logiciels de sauvegarde Veeam et Commvault. Via un service MCP intégré, Guardian peut aussi dialoguer avec une IA externe pour remonter des diagnostics à une autre console d’administration ou appliquer des mesures quand on lui envoie des alertes.
À ce titre, précisons que l’arrivée de Guardian dans ses produits a incité Scality à revoir ses tarifs. Il existe ainsi désormais une formule Gold qui facture une maintenance à distance de la part de l’éditeur. Une activité rendue possible par les diagnostics que Guardian envoie et les ordres qu’il peut recevoir.
