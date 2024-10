Il n’aura pas fallu attendre longtemps pour que les autres fournisseurs de baies de stockage imitent NetApp dans sa fourniture d’une base de données vectorielle pour faciliter les opérations de RAG. Vast, l’entreprise de Jeff Denworth (en photo), lance InsightEngine, un système qui convertit à la volée les métadonnées de sa Vast DataBase, le dispositif qui indexe les contenus dans ses baies, en vecteurs directement utilisables par des modèles d’IA. Ce mécanisme, le RAG, permet aux entreprises d’inclure leurs propres données dans les IA génératives qu’elles utilisent.

« C’est un peu comme si les fournisseurs d’infrastructure de stockage traversaient une crise d’identité. Ils ne veulent plus être seulement ceux qui livrent une boîte dans laquelle on met des données, ils veulent devenir des acteurs de la gestion des données », observe l’analyste Matt Kimball, du cabinet d’études Moor Insights & Strategies.

De fait, les chatbots d’IA générative ne peuvent inclure les données d’une entreprise dans leurs réponses que si elles sont converties en vecteurs mathématiques. À l’origine, ces données sont soit des fichiers, soit des informations structurées dans des bases de données de type SQL (Oracle, SAP…) ou autre. La conversion est donc une étape, au mieux, chronophage, au pire, compliquée. Les fournisseurs de baies de stockage intégrant dans leurs équipements des systèmes d’indexation des contenus, ils sont les mieux placés pour automatiser toute l’opération et convertir les données en vecteurs au fil de l’eau, voire dès qu’elles sont créées.

Matt Kimball prédit que d’autres fournisseurs de stockage suivront bientôt la voie tracée par NetApp et Vast, pour répondre à la demande, en forte croissance, d’infrastructures adaptées à l’IA générative dans les entreprises. Il suggère toutefois que les initiatives des constructeurs, concernant une mise en forme propriétaire des bases vectorielles pour le RAG, posent le risque de verrouiller les entreprises sur la technologie d’un fournisseur ou l’autre.

À la lecture des détails techniques partagés par Vast, il n’est pas très clair de savoir si Vast a mis au point tout seul une extension vectorielle pour sa base d’indexation des contenus Vast DataBase, ou s’il greffe cette dernière par un moyen qui lui est propre à une base vectorielle fournie par Nvidia, avec lequel il se targue de travailler. Toujours est-il que la solution de Vast permet d’inclure dans le RAG des fichiers (documents) et des bases SQL, tandis que celle de NetApp inclut des fichiers et des données au format objet (e-mails, applications web…).

De nouvelles configurations d’IA avec Cisco

Même s’il propose des baies de stockage à sa marque – qu’il fait assembler par SuperMicro – Vast met surtout en avant que son système d’exploitation (Vast Data Platform) peut transformer un cluster de serveurs de n’importe quelle marque en un NAS parallélisé. HPE propose d’ailleurs ce système d’exploitation sur ses baies Alletra, quand il les vend comme des NAS (partage de fichiers) et non plus comme des SAN (mode bloc).

En marge de l’enrichissement de son système pour le RAG, Vast annonce ainsi avoir conclu un nouveau partenariat matériel avec Cisco, pour déployer Vast Data Platform sur ses serveurs UCS constitués de Xeon de 4e ou 5e génération et de SSD NVMe.

Le cluster de stockage résultant peut communiquer avec les serveurs de calculs (ceux qui exécutent les applications) via plusieurs liens Ethernet RoCE ou Infiniband en 200 ou 400 Gbit/s. En option, les machines Cisco UCS peuvent être équipées de DPU BlueField 3 de Nvidia pour accélérer encore la bande passante utile vers les serveurs de calcul et de GPU L40S de Nvidia afin d’accélérer la vectorisation des données.

Comparativement, les dernières baies AFF A70, A90 et A1K de NetApp sont équipées de connexions Ethernet RoCE en 200 Gbit/s, de Xeon de 4e génération et, en option, des mêmes GPU pour la vectorisation. L’avantage actuel des baies NetApp est qu’elles sont déjà disponibles, alors que les configurations UCS fonctionnant sous Vast Data Platform devraient arriver courant 2025.