Une carte FPGA à insérer dans une baie de disques pour accélérer les traitements analytiques côté stockage et économiser du temps de calcul côté serveurs applicatifs. Telle est l’idée de la startup chinoise StorageX qui vient de s’installer dans la Silicon Valley, où LeMagIT a pu la rencontrer à l’occasion d’un événement IT Press Tour consacré aux startups qui innovent en matière de stockage.

« Notre carte Lake TI P150 est capable de faire trois choses. Formater les données en amont pour laisser plus de temps de calcul disponible aux CPUs et GPUs dans le contexte d’une IA générative. Décoder les paquets réseau entrant et sortant au niveau de la baie de stockage pour réduire la latence des accès aux données. Et exécuter au niveau de la baie de stockage tout type d’opération susceptible de soulager les serveurs », explique Stephen Yuan, le PDG de la société, lors d’un entretien avec LeMagIT.

StorageX n’est pas le seul acteur qui propose de déplacer des calculs sur le stockage. LeMagIT avait notamment interviewé la startup ScaleFlux à ce sujet. Pour autant, cette dernière proposait de mettre une puce de calcul dans chaque SSD, ce qui pose la contrainte de pouvoir lui acheter des SSD. La solution de StorageX est a priori plus abordable, dans le sens où elle consiste à installer une carte PCIe dans une baie de disques du marché.

Citons également la startup Fungible, qui développe aussi des cartes PCIe, à base de DPU, mais avec la contrainte d’installer une carte dans la baie de disques et une autre dans chaque serveur.

Des perspectives alléchantes, mais pas encore d’exemples concrets

Stephen Yuan argumente que disposer une capacité de calcul au plus proche des données présenterait plusieurs avantages. D’une part, en envoyant aux serveurs seulement les données prêtes à consommer et non toutes celles à trier, une entreprise réduirait le trafic de son réseau et donc son coût. D’autre part, en se délestant de la partie purement logistique des traitements, les processeurs et les GPUs, les composants les plus chers d’un cluster, pourraient accomplir plus rapidement leurs calculs. Globalement, le rendement du cluster serait meilleur.

Pour autant, la startup peine encore à fournir des exemples concrets au-delà des possibilités théoriques qu’elle met dans ses présentations. On comprend que la puce FPGA de sa carte, reprogrammable à l’envi, peut recevoir le code de n’importe quelle accélération.

Là, StorageX la voit dans des usines pour interpréter les relevés des sondes et envoyer des alarmes ou des ajustements aux machines-outils. Là, il la verrait bien chez des hébergeurs de cloud pour accélérer leurs offres IaaS, PaaS et SaaS ; du moins quand l’application nécessite un datalake. Là, encore, la startup imagine sa carte dans des véhicules autonomes pour rendre leurs puces de calcul de trajectoire plus réactives.

L’application qui semble la plus concrète – car elle existe déjà ailleurs - est celle où la carte Lake TI étiquetterait des vidéos selon leurs contenus, depuis les baies de stockage des diffuseurs de média.