Dossier GTC 2026 : tout ce qu’il faut savoir des dernières infrastructures Nvidia
Introduction
Comme chaque année, Nvidia a organisé sa grande conférence GTC à la mi-mars à San José, dans la partie sud de la Silicon Valley. Cette année, le public se doutait d’autant moins des annonces qui devaient y être faites, car Nvidia avait déjà dévoilé sa nouvelle génération de puces pour l’IA des semaines auparavant, lors du salon international CES de janvier. Et pourtant.
Cette édition 2026 de la conférence GTC restera celle de la grande réorientation stratégique. Le concepteur de puces accélératrices a présenté des serveurs, dont certains sans GPU, une baie de stockage de données et des équipements réseau clés en main. Il ne veut pas concurrencer les fabricants habituels de matériels pour datacenters. Il veut leur vendre des cartes mères qu’il produit lui-même et sur lesquelles ils n’ont plus qu’à poser leur logo.
Jensen Huang, le patron de Nvidia, est tellement persuadé que ce modèle fonctionnera qu’il prédit une augmentation de son chiffre d’affaires à 1000 milliards de dollars en 2027.
Ce dossier détaille les puces qui ont été annoncées avant la GTC 2026 et les produits d’infrastructure qui l’ont été pendant cette conférence. Il analyse les éléments de stratégie de Nvidia et les met en perspective. D’une part, par rapport aux dernières évolutions des technologies concurrentes. D’autre part, dans le contexte de réglementations et de trafic qui est propre à la criticité des produits de Nvidia.
1Stratégie-
En route pour des chiffres d’affaires record
PDG de Nvidia : « nous atteindrons un CA de 1000 milliards de dollars en 2027 »
En marge de la conférence annuelle GTC 2026, Jensen Huang s’est livré en comité réduit à des confidences sur sa stratégie et ses objectifs. Selon lui, 2026 est l’année charnière entre l’entraînement des IA en cloud et son inférence sur les sites des entreprises. Lire la suite
Réseaux optiques : Nvidia s’associe avec ses concurrents pour standardiser l’OCI-MSA
Le consortium OCI-MSA doit permettre à tous les fabricants de proposer le même dispositif CPO qui encode les paquets en signaux optiques depuis l’intérieur d’un switch. Le fait saillant est que, pour la première fois, Nvidia va travailler à casser son hégémonie. Lire la suite
IA : Nvidia investit 2 milliards dans Nebius pour qu’il lui achète des puces
Le neocloud profitera de ce financement pour déployer 5 GW de puissance de calcul d’ici à 2030. L’argent que Nvidia met dans ses propres clients a pour conséquence de booster les actions en bourse, alors que la crainte d’une bulle financière existe. Lire la suite
2Puces-
Toute une nouvelle génération d’accélérateurs
Puces IA : Nvidia détaille sa prochaine génération Rubin au CES
Entre le GPU Rubin, le processeur Vera et les nouveaux contrôleurs réseau, ce ne sont pas moins de six nouvelles puces que Nvidia lancera sur le marché des centres de calcul d’ici à la rentrée prochaine. Lire la suite
Puces IA : Nvidia dévoile le Rubin CPX pour l’inférence
Le constructeur a dévoilé les caractéristiques probables du GPU qu’il lancera d’ici à la fin de l’année 2026 pour accélérer l’inférence. Lire la suite
3Solutions-
Des machines prêtes à l’emploi pour l’IA
GTC 2026 : maintenant, Nvidia part à la conquête des serveurs
Le numéro 1 des puces accélératrices pour l’IA a ouvert son salon annuel avec la présentation de serveurs prêts à l’emploi, dépourvus de ses derniers GPU Rubin, mais servant tout de même à exécuter des IA. Les autres fabricants de serveurs sont priés d’acheter des licences. Lire la suite
GTC 2026 : Nvidia impose un nouveau type de stockage
Le fabricant a dévoilé lors de son salon annuel le concept inédit d’une baie de SSD qui résout le problème du rechargement à toute vitesse d’une conversation avec une IA. Les fournisseurs applaudissent l’idée, mais ne se bousculent pas pour revendre la machine. Lire la suite
GTC 2026 : Nvidia met la puissance de ses serveurs dans une station
La nouvelle DGX Station est une machine qui tient dans un boîtier tour ATX et qui est censée permettre à une équipe de faire localement, sans frais supplémentaires, tout ce qu’elle ferait en ligne avec des services d’IA exécutés sur serveur DGX GB300. Lire la suite
4Concurrence-
Des alternatives sérieuses existent
Puces : AMD bat encore ses propres records de vente
Avec des ventes en progression de 34 % en 2025, AMD continue de réduire l’écart qui le sépare d’Intel. Mais son objectif est désormais de s’imposer face à Nvidia. Lire la suite
La puce géante de Cerebras motorisera les IA d’AWS
L’hyperscaler américain utilisera l’accélérateur WSE-3 d’une puissance de 125 pétaflops pour seconder ses propres puces Trainium3 dans ses services d’IA générative. La répartition des calculs entre les deux composants, appelée inférence désagrégée, est inédite. Lire la suite
IA générative : Helikai et FuriosaAI proposent un serveur tout-en-un
L’Américain Helikai a mis au point une plateforme logicielle complète pour le RAG, l’inférence selon les secteurs d’activité et la modélisation de processus métiers assistés par des IA. Il la vend dans un serveur doté des accélérateurs du Coréen FuriosaAI. Lire la suite
5Contexte-
Une situation géopolitique autour des solutions de Nvidia
Puces IA : les GPU de Nvidia encore autorisés puis interdits en Chine
Alors que Nvidia s’apprêtait à pouvoir honorer une commande chinoise de 2 millions de GPU H200, Pékin vient d’interdire à nouveau leur importation. Entre stocks baladeurs de GPU puissants et politiques d’export incertaines, l’Europe prie pour être fournie. Lire la suite
IA : une nouvelle loi pour asseoir la suprématie des USA
Le gouvernement étatsunien planche sur un nouveau texte dans lequel plus aucun pays n’aurait le droit d’acheter des puces accélératrices sans lui demander son accord et sans investir sur le sol américain. Lire la suite
Des membres de Supermicro accusés d’avoir détourné des GPU Nvidia
Le président du constructeur américain et deux complices auraient frauduleusement expédié vers la Chine l’équivalent de 2,5 milliards de dollars en serveurs d’IA. Lire la suite
