Guides Essentiels

GTC 2024 : le guide du nouveau leadership de Nvidia

Introduction

Nvidia, nouveau numéro 1 de l’informatique d’entreprise ? C’est en tout cas ce que tous les chiffres prédisent. Ceux de la bourse américaine pour commencer. Nvidia a franchi la barre des 1 000 milliards de dollars en valeur au milieu de l’année 2023, dépassant Amazon et Alphabet, la maison-mère de Google et faisant de lui la troisième plus grande société américaine cotée en bourse. À la fin de l’année 2023, les actions de Nvidia avaient progressé de 239 % en un an. 

Concernant les ventes, le dernier chiffre d’affaires trimestriel de Nvidia atteint 22,1 milliards de dollars. Il a bondi de 265 % en un an et frôle désormais celui de Dell (25 mds $), le plus gros vendeur d’équipements aux entreprises. Il est aussi supérieur à celui d’Intel et d’AMD (respectivement 15,4 et 6,17 mds $), les champions des processeurs dans les serveurs. Et il est même meilleur que celui d’Apple, hors iPhone et accessoires domestiques (14,8 mds $ pour les Mac et les iPad lors du dernier trimestre). 

Surtout, les technologies d’avant-garde de Nvidia redynamisent manifestement les investissements dans les datacenters privés, de l’ordre de +25 % par an à présent, alors que le secteur était plutôt moribond depuis l’avènement du cloud public. 

Nvidia est aujourd’hui le plus important producteur de GPU du monde. Les GPU sont des puces initialement conçues pour accélérer la génération d’images à partir de formules mathématiques. Celles de Nvidia peuvent à présent traiter des quantités énormes d’équations nécessaires à l’entraînement des modèles d’IA générative, comme ChatGPT et Gemini. Puisque Nvidia dominait ce marché avant que l’IA ne s’impose aux entreprises, le fournisseur n’a fait que croître à mesure que la demande montait en flèche. 

Selon le cabinet Bloomberg Intelligence, le secteur de l’IA devrait connaître un taux de croissance annuel de 42 % au cours des dix prochaines années. Le marché des équipements et des logiciels dédiés à l’IA pourrait peser 1 300 milliards de dollars d’ici à 2032. 

Tel est le contexte dans lequel s’est récemment clos l’événement annuel GTC 2024. Lors de cette édition de sa grande conférence annuelle, Nvidia n’a pas fait qu’annoncer de nouveaux produits : des puces Blackwell qui repoussent les limites de la puissance de calcul, des logiciels NeMo qui assoient ses technologies dans la conception des applications d’IA. Son patron Jensen Huang a aussi déroulé sa vision stratégique : désormais, les ordinateurs ne seront plus construits comme ils l’ont été depuis les années 70. 

En plaçant la RAM au centre des circuits du processeur plutôt qu’ailleurs sur la carte mère, les machines deviendront tellement puissantes comparativement aux bandes passantes réseau, que le téléchargement d’informations sera minoré au bénéfice d’une génération d’information par l’IA. Même un smartphone pourrait à terme générer les prochaines images d’une vidéo sans avoir besoin de télécharger leurs pixels. 

On ignore quand Nvidia déclinera ses GPUs très haut de gamme H100 et B200 – respectivement 700 et 1 200 W de dissipation thermique, soit cinq fois plus qu’un Xeon – dans des appareils d’appoint. En attendant, le constructeur pose déjà de nouveaux standards dans les serveurs. À commencer par une connectique réseau en très haut débit. Jusqu’à 400 Gbit/s, entre les GPUs et les baies de stockage où se trouvent les données à ingérer dans les moteurs d’IA, qu’il s’agisse de la phase d’entraînement comme de celle d’inférence. 

C’est ainsi que les annonces les plus retentissantes de la conférence GTC 2024, mises à part celles de Nvidia, sont venues des fournisseurs de baies de stockage. Tous ont mis à jour leurs offres pour proposer des solutions spécialement adaptées aux serveurs DGX et OVX, les nouveaux formats de machines que Nvidia compte imposer dans les data centers.

Ce guide a vocation à faire le point sur cette stratégie et ces annonces.

1Stratégie-

Comment Nvidia devient doucement no 1 des fournisseurs d’infrastructure

Actualités

Jensen Huang : « Nvidia redynamise le marché des datacenters »

Le patron de Nvidia prédit une relance des investissements dans les datacenters au profit de nouveaux serveurs accélérés pour l’IA. Étant de loin le leader dans ce domaine, Nvidia se voit même devenir le No 1 de l’informatique. Lire la suite

Actualités

GTC 2024 : « chez Nvidia, nous œuvrons surtout à simplifier l’IA »

Dans cette interview, le directeur des produits d’accélération de Nvidia explique pourquoi il est nécessaire de réentraîner constamment les modèles d’IA, avec quels scénarios économiques et quelles perspectives fonctionnelles. Lire la suite

Actualités

Accélérateurs : une fondation se mobilise contre Nvidia

Intel, ARM, Qualcom, Fujitsu se réunissent dans la fondation UXL, affiliée à la fondation Linux, pour militer contre les outils de développement de type CUDA qui produisent du code seulement pour les GPUS Nvidia. Lire la suite

2Produits-

Des matériels surpuissants et un ensemble complet de kits logiciels

Actualités

GTC 2024 : Nvidia dévoile son GPU Blackwell

La puce B200 succède à l’actuelle H100 et à la H200 dont les livraisons commencent à peine auprès de certains clients. Elle s’accompagne d’un nouveau réseau NVLink-5 depuis plus performant. Lire la suite

Actualités

GTC 2024 : Nvidia pousse sa stratégie du « tout-en-un »

Lors de la GTC 2024, l’éditeur et spécialiste du GPU a complété son offre logicielle en présentant des « microservices », plus précisément une collection d’images de conteneurs préparées contenant des outils consacrés à l’entraînement, mais surtout à l’inférence de grands modèles de langage. Lire la suite

Actualités

Demain, Nvidia aura une IA pour modéliser en 3D à partir de prompts

Le projet LATTE3D doit générer des objets modélisés en 3D à partir de simples prompts. Selon les analystes il servira plus à exporter des objets dans l’environnement Omniverse de Nvidia qu’à remplacer les outils de conception 3D. Lire la suite

3Écosystème-

Les fournisseurs de stockage mobilisés derrière Nvidia

Actualités

GTC 2024 : Dell branche les données à l’IA via un Ethernet peu cher

Les nouveaux nœuds de stockage PowerScale F710 connectent l’ensemble des données stockées sur des clusters OneFS à des serveurs de calcul Nvidia DGX, de la manière la plus économique possible. Lire la suite

Actualités

Stockage : HPE accélère et densifie ses Alletra MP

Dans un même espace, les nouvelles versions des Alletra MP offrent quatre fois plus de capacité à deux fois plus de serveurs. La version SAN gagne aussi l’interconnexion de tous ses nœuds pour une latence réduite. Lire la suite

Actualités

Stockage : IBM met toutes les données de l’entreprise dans l’IA

En démonstration lors de la conférence GTC 2024 de Nvidia, les nouvelles baies Storage Scale System 6000 mettent du très haut débit entre les données qu’une entreprise stocke ailleurs et les serveurs de calculs DGX. Lire la suite

Actualités

GTC 2024 : Weka présente le stockage le plus rapide pour l’IA

L’éditeur du système de fichiers hautement parallèle WekaFS a fait la démonstration d’une baie de stockage matérielle qui bat tous les records de vitesse pour alimenter les serveurs DGX de Nvidia en données. Lire la suite

Actualités

Stockage : DDN accélère sa solution de référence pour Nvidia

Le fabricant lance une version « Turbo » de sa baie EXAscaler AI400X2 que Nvidia recommande à tous les clients de ses calculateurs d’utiliser. La baie met surtout en valeur les derniers contrôleurs réseau de Nvidia. Lire la suite

Actualités

Stockage : NetApp et Pure Storage misent sur l’IA simple et peu chère

Les deux fabricants ont annoncé des connecteurs qui permettent de nourrir les IA génératives vendues par Nvidia avec les données stockées sur leurs NAS. Une technique connue sous le nom de RAG. Lire la suite

Close