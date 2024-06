Pure Storage met à jour son offre commerciale pour mieux répondre aux projets d’intelligence artificielle de ses clients. Trois sujets sont plus particulièrement couverts. D’abord, la manière de facturer le stockage dans le contexte d’un entraînement de grand modèle. Ensuite, la livraison de fonctions en plus dans le cadre d’un usage de l’IA sur les données d’une entreprise. Enfin, l’enrichissement des consoles d’administration avec un copilote intelligent qui améliore la gouvernance des données.

Ces annonces ont été formulées dans le cadre de la conférence Pure/Accelerate 2024 qui se tient cette semaine à Las Vegas.

Jusqu’ici, le constructeur avait moins communiqué que ses concurrents sur l’IA. Il part du principe que ses baies, déjà suffisamment rapides, n’avaient pas besoin, elles, de mises à jour matérielles pour s’interfacer avec le haut débit des GPUs Nvidia. De fait, aucune annonce matérielle n’a été formulée durant cette nouvelle édition de sa conférence annuelle.

Pure Storage se distingue des autres fabricants de baies de stockage par l’utilisation dans ses produits de modules Flash maison, les DFM. Ceux-ci sont 2,5 fois plus capacitifs et plus rapides que les SSD ordinaires que l’on trouve partout ailleurs.

Nouveau programme Evergreen//One for AI Les très grands comptes – parmi lesquels des hébergeurs – qui déploient des clusters de GPU Nvidia vont bénéficier d’un nouveau contrat Evergreen//One for AI. Celui-ci facture non plus les baies NAS FlashBlade au seul usage de leurs capacités de stockage, mais tient aussi compte de la bande passante réellement utilisée. Selon le constructeur, les entraînements de modèles d’IA nécessitent à la fois des données de travail qui sont accédées de manière intensive et des données au repos qui sont soit celles déjà traitées, soit celles en cours de préparation pour le prochain train de calcul. Si l’ensemble consomme les mêmes disques Flash, les données au repos sollicitent beaucoup moins les capacités de communication des baies FlashBlade. Le programme commercial Evergreen//One for AI propose donc de déployer sur site des baies FlashBlade//S500 excessivement performantes, mais de ne les payer qu’au prix de baies FlashBlade//E d’entrée de gamme tant que leur haut débit n’est pas utilisé. En l’occurrence, une FlashBlade//S500 est un boîtier 5U contenant deux processeurs, huit ports Ethernet en 100 Gbit/s chacun et un maximum de dix lames de stockage équipées, chacune, de quatre DFM (les SSD particuliers de Pure Storage) avec NAND QLC. Outre la vitesse débrayable des ports Ethernet, la variation des performances se fait au niveau des lames : soit la baie n’utilise qu’un DFM par lame de stockage à pleine vitesse, soit elle utilise les quatre (plus de capacité), mais chacun avec un quart de la vitesse possible. Lors du salon Pure/Accelerate 2024, Pure Storage a annoncé l’arrivée de nouveaux DFM QLC d’une capacité de 150 To, soit le double des actuels DFM QLC en 75 To. Accessoirement, les baies FlashBlade viennent à leur tour d’être certifiées par Nvidia pour être utilisées avec ses clusters DGX, lesquels correspondent à un modèle type de serveurs remplis de GPU et montés en réseau. Ces clusters DGX constituent l’artillerie lourde que les hébergeurs sont censés déployer pour proposer des services d’entraînement de grands modèles d’IA, ou même des services de supercalcul.

Pure Fusion v2 et des kits Open source pour l’inférence Pure Storage assimile l’usage de l’IA en entreprise au RAG et à l’inférence, c’est-à-dire au fait de formuler des requêtes à un LLM préentraîné en lui demandant de puiser ses réponses dans les données locales. Pour favoriser cette pratique, Pure Storage va fournir avec ses baies FlashBlade un ensemble de logiciels Open source qui vont permettre, typiquement, de vectoriser les données existantes (fichiers bureautiques ou multimédias) afin de pouvoir les insérer de manière transparente dans les prompts. De plus, Pure Storage intègre désormais la fonction Pure Fusion dans le système d’exploitation Purity de ses baies de stockage. Celle-ci consiste à réunir plusieurs baies – qu’elles soient physiques ou qu’il s’agisse de baies Purity virtuelles en cloud – en un seul pool de stockage. L’enjeu est de pouvoir soumettre à l’IA des informations qui proviennent de différents silos de données entretenus par différentes directions métier dans l’entreprise. Pure Fusion existait déjà depuis deux ans. Mais il s’agissait jusque-là d’un service web, tarifé en option, uniquement destiné à lier entre elles des baies FlashArray en mode bloc. Cette option n’a non seulement pas connu de très grand succès commercial, mais elle était surtout totalement inutilisable dans le cadre d’une IA qui, elle, accède aux données en mode fichier ou objet. La nouvelle version 2 de Pure Fusion sera intégrée gratuitement, d’ici à la rentrée, dans le système Purity de toutes les baies de Pure Storage, c’est-à-dire y compris dans les NAS FlashBlade. Enfin, le nouvel assistant Copilot intégré à la console d’administration Pure1 des baies Purity est juste un moyen de lancer des opérations de maintenance et de diagnostic avec de simples ordres écrits en langage courant dans l’interface d’un chatbot. Comme absolument tous les autres fournisseurs de stockage, de serveurs, de solutions de sauvegarde, ou encore d’équipements réseau qui ont déjà fait la même chose, Pure Storage prétend que ne plus avoir à passer par d’interminables menus, onglets et autres boutons contribuera à améliorer l’efficacité et le confort des administrateurs.