Stockage : DDN se perfectionne pour rester le fournisseur no 1 des clusters d’IA
Porté par la dynamique de l’IA, le fournisseur de solutions de stockage DDN présente des produits encore plus rapides et plus adaptés aux entreprises. Il vise le milliard de dollars de chiffre d’affaires pour l’année 2025.
Paul Bloch, co-fondateur et président de DDN est d’humeur joyeuse. Avec son comparse Alex Bouzari, ils ont fondé une entreprise qui pèse aujourd’hui 5 milliards de dollars et devrait réaliser 1 milliard de chiffre d’affaires en 2025. Au début de cette même année, l’entreprise a sécurisé un investissement de 300 millions de dollars de la part du fonds Blackstone, contre 6 % du capital et un siège au conseil d’administration.
Quant à la suite, les clusters de calculs qui sont aujourd’hui clients de ses baies de stockage pourraient tripler, voire quadrupler leurs commandes d’ici à 2027. « 200 000 GPUs sont déployés dans le cluster de xAI, installé à Memphis et ce nombre devrait atteindre le million prochainement. La montée en puissance des GPU conduit à des besoins de stockage des données de plus en plus importants, car la seule manière de prendre de l’avance est d’ingérer de plus en plus de données en temps réel », explique Paul Bloch.
Et puis il y a le marché des entreprises classiques, lui aussi très prometteur. « L’IA n’a pas encore atteint ses objectifs, mais les entreprises visualisent l’évolution et ce qu’il va être possible de faire. Le véritable essor se produira quand les entreprises se lanceront pleinement dans l’inférence, l’exploiteront et l’appliqueront à tous les secteurs d’activité », estime Sven Oehme, le directeur technique de DDN, que LeMagIT a rencontré à l’occasion d’un événement IT Press Tour consacré aux acteurs du stockage dans la Silicon Valley.
Selon Paul Bloch, l’appui de Blackstone est un atout supplémentaire pour aider DDN à trouver des clients en dehors des centres de calcul traditionnels.
« L’IA, ce sont des investissements de 1 à 2 milliards de dollars qui deviennent courants pour des entreprises dont on ne connaît même pas le nom. Les décisions sont désormais prises par les directions générales ou les directions des données qui voient le potentiel d’économies autour de l’IA, en particulier dans des applications industrielles. Dans ce contexte, Blackstone n’est pas qu’un investisseur, mais un véritable partenaire qui nous ouvre son carnet d’adresses. »
Une EXAscaler AI400x3 plus robuste pour les entreprises
Pour atteindre ces objectifs, DDN vient de mettre à jour sa famille de produits. Après la baie EXAscaler AI400X2 Turbo commercialisée l’année dernière, il lance l’AI400X3 qui intègre désormais 24 SSD NVMe dans son boîtier et supporte des tiroirs de SSD supplémentaires reliés en NVMe-over-Fabrics à la rentrée prochaine. Les performances auraient été améliorées de 55 % en lecture et de plus de 70 % en écriture, soit un cumul de 140 Go/s en lecture et entre 75 et 100 Go/s en écriture. Ce gain de vitesse tient à l’utilisation de quatre cartes réseau BlueField de Nvidia, qui communiquent chacune en 400 Gbit/s (environ 40 Go/s) au protocole Spectrum-X du même fabricant.
« Nous avons déjà une architecture de référence avec leur nouveau GPU Blackwell. Elle a été la première à être homologuée. D’ailleurs, tout le développement et les tests de Blackwell ont été réalisés avec des équipements DDN, comme ces deux dernières années pour toutes les générations précédentes », se félicite Sven Oehme.
« Nous pouvons à présent remplacer n’importe quel composant matériel ou logiciel sans arrêter la baie. Les risques de temps d’arrêt sont réduits au minimum. »
Sven OehmeDirecteur technique, DDN
Les autres améliorations concernent la sécurité et à la mutualisation. Cette dernière s’adresse essentiellement aux fournisseurs de services managés (MSP), dont les hébergeurs de cloud. Elle leur permet de provisionner dynamiquement des parties individuelles de la baie pour des clients de plus en plus nombreux.
Toujours dans l’optique d’une nouvelle clientèle d’entreprises, l’EXAscaler AI400X3 sait à présent compresser ses données, pour offrir – comme chez NetApp, Dell ou HPE – une capacité « utile » plus importante que la capacité brute des SSD.
« Et puis, nous avons considérablement amélioré la robustesse. Nous pouvons à présent remplacer n’importe quel composant matériel ou logiciel sans arrêter la baie. Les risques de temps d’arrêt sont réduits au minimum. C’est fondamental, car les entreprises refusent toute interruption. Au contraire des centres de calcul qui, en cas d’incident, préfèrent diagnostiquer eux-mêmes le problème avant de nous solliciter », raconte encore Sven Oehme.
Infinia 2.1, le stockage objet accéléré pour l’IA
L’EXAscaler AI400 est une baie qui partage ses contenus en mode fichier. Mais la tendance dans les entreprises est d’utiliser l’IA avec des baies de stockage en mode objet qui, bien que moins rapides, offrent plus de capacité de stockage et d’options pour étiqueter ou filtrer les contenus soumis à une IA, que ce soit pour son réentraînement ou la fourniture de données privées en inférence, via une technologie de RAG. C’est pour ce besoin-là que DDN a lancé en 2024 la solution de stockage objet Infinia.
Cette solution évolue à présent en une version 2.1 beaucoup plus rapide. DDN parle d’une vitesse multipliée par 100. Elle concurrence de fait les autres solutions de stockage en mode objet qui ont récemment été profondément accélérées pour soutenir la vitesse des GPUs : HyperStore de Cloudian, MinIO, ou encore Ring de Scality.
DDN se plaît à comparer sa solution avec le service de stockage S3 Express que l’hyperscaler AWS propose aux entreprises qui exécutent des tâches d’IA dans son cloud. Infinia 2.1 serait dix fois plus rapide dans les accès et répondrait 25 fois plus vite aux requêtes.
La solution dispose de connecteurs vers la plupart des piles logicielles pour l’IA, dont TensorFlow, PyTorch, mais aussi Apache Spark. Elle dispose de modules NIM dédiés dans la suite logicielle AI Enterprise de Nvidia. Tout ceci était présent dès la version 2.0 lancée il y a quelques semaines. La mise à jour 2.1 ajoute des intégrations aux plateformes d’observabilité de Datadog et de Chronosphere ainsi qu’à toutes celles reposant sur OpenTelemetry. Elle peut aussi désormais être reliée à un lac de données Hadoop.
Livrée par DDN sur ses propres matériels, Infinia 2.1 est également utilisable en version virtuelle sur GCP.
DDN propose également deux autres matériels : xFusionAI et Inferno. xFusionAI n’est ni plus ni moins qu’une baie EXAscaler AI400X3 qui exécute à la fois son propre système de partage de fichiers (Lustre) et Infinia 2.1 pour accéder aux mêmes données en mode objet (au protocole S3), avec l’avantage des métadonnées qui indexent leurs contenus.
Inferno est pour sa part une sorte d’équipement réseau proxy qui s’installe entre une appliance Infinia et les serveurs de calcul. Son but est d’accélérer les communications du stockage objet à la vitesse du stockage Lustre. À ce titre, l’appareil dispose à la fois d’un switch basé sur des puces BlueField de Nvidia – qui implémentent le protocole Spectrum-X et, surtout, GPUdirect pour parler directement aux GPU – et de SSD NVMe qui font office de cache.
11 000 clients dans le monde, dont 4 000 pour l’IA
DDN indique avoir d’ores et déjà déployé ses solutions de stockage pour plus de 700 000 GPU chez 11 000 clients, dont 4 000 exécutent des traitements d’IA. Le fournisseur emploie 1 100 personnes, dont 600 ingénieurs, et prévoit 200 à 250 embauches supplémentaires cette année.
À l’origine, en 1998, DDN est un fournisseur de baies de stockage pour les seuls centres de recherches équipés en supercalculateur. Son savoir-faire tient dans sa faculté à alimenter, depuis une baie de stockage, de nombreux nœuds de calcul en parallèle. C’est ce qui convainc Nvidia de travailler avec lui dès 2010.
« Prenez 10 000 GPU. Si vous souhaitez obtenir un Go/s en lecture par GPU, il vous faut un débit de 10 To/s au niveau de la baie. Il y a très peu de systèmes au monde capables de fournir 10 To/s en lecture et en écriture. C’est quelque chose que nous, nous maîtrisons extrêmement bien », se félicite Paul Bloch.
DDN revendique avoir comme client 85 entreprises du Fortune 500, sept des plus grandes entreprises financières et huit des dix principaux fournisseurs de cloud. En France, ce sont EDF, le CEA, Total et, de manière générale, toute l’industrie nucléaire qui se fournit chez lui. C’est également le cas de la banque BNP Paribas, sans oublier de très nombreux constructeurs automobiles (Ford, Toyota, Honda, Tesla, Mercedes, Suzuki…).
Les courtiers de la finance qui travaillent à haute fréquence commencent également à s’intéresser à ce type de solutions, alors qu’ils ne juraient que par des baies de stockage classiques il y a encore un an.