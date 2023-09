En février dernier, OVHcloud avait détaillé sa feuille de route pour ses produits PaaS et IA. Du côté IaaS, le fournisseur avait principalement communiqué sur ses capacités de stockage et réseau.

Outre la refonte du réseau pour améliorer le trafic est-ouest dans ses data centers, OVHcloud a racheté OpenIO pour se doter d’une solution de stockage objet compatible S3, qui est d’ores et déjà disponible, et Exten pour sa brique de stockage bloc NVMe Over Fabrics, qui arrivera en bêta cette année dans le cloud public.

Pour autant, le nerf de la guerre, actuellement, semble davantage l’accès aux capacités de calcul. Là aussi, OVHcloud avait ses plans. Il les met aujourd’hui à exécution.

Pour rappel, le fournisseur désormais considéré comme un hyperscaler par IDC proposait des instances dotées de GPU V100 et V100s de Nvidia. À la traine par rapport à ses concurrents américains, OVHcloud entend bien prouver que lui aussi peut accueillir les charges d’IA générative.

« L’IA a besoin de fondations qui sont le calcul, le stockage et le réseau. Cela fait des années que nous faisons en sorte de proposer l’état de l’art de ces primitives-là. », affirme Yaniv Fdida, Chief Product Officer chez OVHcloud.

A100, H100, L40S, L4… OVHcloud prend tout (ou presque)

Aux instances équipées de Nvidia Tesla V100 (16 Go de VRAM) et V100s (32 Go de VRAM) s’ajoutent des offres s’appuyant sur les Nvidia A100. Plus spécifiquement, OVHcloud s’est équipé de la version de la puce dotée de 80 Go de VRAM HBM2e, de 6913 Cuda Cores et d’une bande passante allant jusqu’à 2039 Go/s.

Présentés il y a trois ans, les A100 sont actuellement les GPU les plus utilisés lors de l’entraînement et l’inférence de grands modèles de langage (LLM). Toutefois, ici, il ne sera pas possible d’entraîner les plus gros modèles de cette catégorie.

Pour l’heure, OVHcloud propose trois types d’instances équipés de ce GPU disponible dans son offre Public Cloud.

A100-180 dispose de 15vCore (vCPU), 180 de mémoire vive, d’une A100 et 300 Go de stockage sur SSD NVMe, pour une bande passante de 8 Gbit/s. A100-360 couple deux A100, 360 Go de RAM, 30vCore, 500 Go de stockage sur SSD NVMe et est associé à une bande passante de 16 Gbit/s. L’instance A100-720, comme son nom l’indique, inclut 720 Go de RAM, 60 vCore et quatre GPU A100. OVHcloud ne précise pas encore le volume de bande passante associée.

Pour rappel, le LLM open source Falcon-180B, doté de 180 milliards de paramètres, nécessite 400 Go de VRAM pour s’exécuter « rapidement ». Sa déclinaison dotée de 40 milliards de paramètres nécessite 85 à 100 Go de VRAM. En clair, une instance A100-360 suffit amplement pour inférer un modèle comme Falcon-40B ou LLama 2-70B.

« Nous continuerons à développer et à augmenter la capacité des instances que nous mettrons à disposition », promet le Chief Product Officer.