Stockage et IA : l’infrastructure Hitachi iQ se veut la plus complète

Ajoutant des serveurs avec GPU, du réseau et même du stockage parallélisé Hammerspace, la solution n’a plus grand-chose à voir avec la baie de disques VSP One sur laquelle elle repose. Celle-ci apporte néanmoins à l’ensemble des fonctions utiles à l’IA.

Parmi les fournisseurs de stockage qui jouent des coudes pour proposer la baie de disques la plus adaptée à l’IA, Hitachi Vantara a sans doute le mérite d’être celui qui enrobe le mieux sa solution. Avec du storytelling d’abord. Puis avec beaucoup de technologies.

Le fabricant japonais ne perd ainsi jamais une occasion de rappeler que sa maison mère est un puissant conglomérat industriel qui fabrique aussi bien des centrales nucléaires que des trains à grande vitesse, aussi bien des climatiseurs que de l’électroménager. Et toutes ces branches auraient pour point commun de faire de l’IA de pointe avec ses les équipements informatiques d’Hitachi Vantara.

« Notre groupe utilise l’écosystème Omniverse de Nvidia qui propose des jumeaux numériques et se sert de données synthétiques pour réentraîner des IA qui lui permettent de développer et d’étendre ses capacités robotiques dans le secteur manufacturier », illustre Jason Hardy, le directeur technologique spécialisé en IA d’Hitachi Vantara.

Une infrastructure convergée

Le produit d’IA qu’Hitachi Vantara commercialise sous le nom Hitachi iQ va bien au-delà de sa baie de stockage maison VSP One. C’est une infrastructure convergée complète. On y trouve principalement d’un à seize serveurs Supermicro équipés chacun de huit GPU Nvidia pour exécuter les traitements d’IA (configuration de type HGX). Plus une kyrielle de serveurs Hitachi HA G3.

Ces derniers servent d’ordinaire à partager en mode objet les contenus des nœuds de disques de la VSP One. Ils sont ici utilisés pour exécuter, en containers Kubernetes, les logiciels de la couche AI Entreprise de Nvidia. D’une part. D’autre part, un second lot de ces serveurs est utilisé pour exécuter le système de stockage d’Hammerspace. Sa fonction est d’établir des accès parallélisés entre les GPU et le stockage.

Enfin, des switches Cisco Nexus relient tous ces éléments ensemble. Quant à la baie VSP One, d’ordinaire le fer de lance du catalogue Hitachi Vantara, elle n’est finalement plus connectée qu’aux serveurs Hammerspace, pour stocker en mode objet le gros des données que ces serveurs redistribuent en mode fichier.

IQ Time Machine : la baie VSP One donne une mémoire aux LLM

« Pour autant, baser l’ensemble sur notre baie VSP One offre des possibilités exclusives. Parmi elles, notre nouvelle fonction Hitachi IQ Time Machine. Elle permet de soumettre aux LLM des versions précédentes de documents et des données qui ont entretemps été mis à jour », dit Jason Hardy, en argumentant que, sur les autres systèmes de stockage, ces informations auraient été irrémédiablement perdues.

La fonction repose en fait sur la conservation des historiques dans le système objet de la baie VSP One. iQ Studio – le chatbot que fournit Hitachi Vantara avec son infrastructure Hitachi iQ – supporte cette fonction via une nouvelle frise chronologique dans son interface. Ainsi, si un membre d’une équipe financière souhaite interroger l’IA sur un événement dont il ne retrouve plus la trace, il lui suffit de faire glisser le curseur jusqu’à une date antérieure, dans l’espoir que quelqu’un ait à l’époque notifié des détails dans un document éphémère.

D’une manière générale, le stockage des données est une composante critique des projets d’IA, car il réunit trois contraintes inédites pour les fournisseurs. La baie de disques doit communiquer aussi vite que les GPU. Pour le RAG, les données doivent être dans un format compatible avec celui attendu par les modules logiciels de Nvidia qui servent à bâtir les applications d’IA. Et puis, surtout, il faut aider les entreprises à préparer et trier les données qu’elles vont soumettre à une IA.

Avec sa solution iQ, qui dépasse allègrement les seules fonctions de stockage, Hitachi Vantara s’efforce de répondre à ces trois problématiques en même temps.

Pour approfondir sur SAN et NAS