Dell World 2026 : l’infra sur site prend sa revanche sur le cloud

Accompagné sur scène du patron de Nvidia, Michael Dell a ouvert la conférence annuelle de sa marque avec l’annonce d’une nouvelle génération de machines conçues pour exécuter les mêmes IA qu’en cloud, mais sans ses coûts imprévisibles et son manque de souveraineté.

5000 clients dans le monde auraient déjà acheté à Dell les équipements serveur accélérés pour l’IA qu’il vend depuis deux ans sous le nom d’AI Factory. Le marché pour ce type d’équipements est évalué entre 3 et 4 000 milliards de dollars d’ici à 2030, car la génération de tokens aura été multipliée par 35 à ce moment-là. Tels sont les quelques chiffres que le PDG Michael Dell (à droite sur la photo en haut de cet article) a partagé en ouverture de la conférence Dell Technology World qui se tient cette semaine à Las Vegas.

Au cours de celle-ci, le constructeur a présenté les dernières évolutions de son catalogue d’équipements pour exécuter des applications d’IA sur site.

« L’IA est le carburant du retour des serveurs dans les entreprises. Car comment, sinon, déployer les meilleurs modèles au monde là où vous en avez besoin, avec la sécurité et la gouvernance dont vous avez besoin ? », a lancé le PDG sur scène, deux mois après avoir préannoncé de nouvelles stations de travail, des racks de supercalcul et son fameux système de stockage révolutionnaire Lightning FS lors de la conférence GTC 2026 de Nvidia.

C’est lors de cette conférence que Jensen Huang avait prédit que 2026 serait l’année charnière lors de laquelle l’économie de l’IA basculerait de l’entraînement en cloud à l’inférence sur site. Parce que le gros de l’entraînement des modèles a été fait. Parce que les entreprises ont désormais des moyens pour utiliser l’IA d’après leurs données (RAG) ou la faire travailler avec leurs propres outils (agents). Et puis parce que, dans un contexte géopolitique compliqué, l’Europe et les autres régions organisent leur économie pour qu’elle ne dépende plus des traitements effectués depuis les clouds américains.

Numéro un des vendeurs de serveurs pour entreprises, Michael Dell n’est pas peu enthousiaste de prendre sa revanche sur les hyperscalers qui ont limité ses ventes, depuis la fin des années 2010.

« Les plus grandes IA sont désormais exécutables sur nos équipements installés sur site. Si vous êtes client de Google Cloud, sachez qu’ils proposent désormais des instances locales basées sur nos serveurs PowerEdge XE9780 pour pouvoir exécuter chez vous tous leurs modèles Gemini 3 », dit Michael Dell.

Et d’énumérer : SpaceX ferait de même avec Grok, Palantir aussi avec Ontology. OpenAI un peu aussi, avec son agent Codex accéléré pour les serveurs Dell et les données stockées sur les baies ObjectScale, mais qui communique toujours avec GPT 5.5 en ligne. Et puis le Français Mistral, qui entraîne désormais ses modèles sur des serveurs Dell PowerEdge XE9712 (deux processeurs ARM Grace, quatre GPU B200, soit les serveurs GB200 NVL72 de Nvidia) plutôt que sur les infrastructures des hyperscalers et qui vendra bientôt directement lui aussi ses IA sur les machines siglées Dell AI Factory.

Le message est surtout que Dell, contrairement aux autres fabricants de serveurs, ne se contente pas d’exécuter sur ses machines les LLM gratuitement téléchargeables. Le fournisseur entend signer sur ses matériels des adaptations de tout ce qui existe en IA. Et il a le soutien de Jensen Huang, le patron de Nvidia (à gauche sur la photo en haut de cet article), qui a rapidement rejoint Micheal Dell sur scène en lançant : « j’adore venir ici pour faire vendre des ordinateurs Dell ».

Des machines Nvidia sous logo Dell

Il faut dire que le fleuron des machines pour l’IA que Dell lance cette année à base de puces Nvidia revient à des cartes mères entièrement produites par Nvidia et revendues par Dell dans des boîtiers Dell.

Citons, dans le datacenter, le nouveau serveur XE9812 (deux processeurs Vera et quatre GPU Rubin) dont on peut mettre deux unités dans la largeur d’une baie rack et dix-huit en hauteur, pour atteindre 144 GPU et 72 processeurs par baie. Une telle configuration totaliserait 5,5 fois la puissance d’une baie remplie de 18 serveurs GB200 NVL72 de génération précédente et consommerait jusqu’à 130 kW.

L’intérêt de la version au logo Dell est qu’elle est équipée d’un système de refroidissement maison, le PowerCool eRDHX (enclosed Rear Door Heat eXchanger). Il tient dans la porte arrière de la baie et sert d’échangeur thermique aussi bien pour les unités refroidies à l’eau, que pour celles dont la chaleur est évacuée par ventilateur. Ce système hybride, qui s’adapte à toutes les baies, permet de refroidir des unités ventilées (les unités de stockage sur SSD notamment) dont la dissipation thermique cumule jusqu’à 80 kW dans une baie. Concernant les unités par refroidissement liquide, son circuit fermé fait passer une eau sortante à presque 60 °C en une eau entrante à 36 °C.

Sur le bureau, Dell fait la même chose avec les stations de travail mises au point par Nvidia. En particulier pour la dernière DGX Station, ici renommée Dell Pro Max with GB300 (basée sur une puce « Ultra Superchip GB300 » de Nvidia qui regroupe un processeur Grace, un GPU B300 et 288 Go de mémoire HBM, plus 496 Go de DRAM LPDDR5X). Elle est équipée d’un système de refroidissement liquide « Dell MaxCool » en circuit fermé. Dans celui-ci l’eau capte les calories de l’Ultra Superchip et de la RAM, puis les diffuse sur une série de ventilateurs. Précisons que la puce principale consomme et dissipe à elle seule 1,5 kW.

Et sur scène, la machine est toujours présentée comme une revanche face au cloud : « Cette station a la puissance nécessaire pour générer un milliard de tokens en 24 heures. C’est ce que fait un développeur qui fait tourner dix agents d’IA. En cloud, ces 24 heures vous auraient coûté 3 400 dollars ! Sur le bureau, avec cette station que vous possédez, elles vous coûtent zéro dollar », lance Jeff Clarke, le numéro deux de Dell. Il ne précise en revanche pas le prix d’achat de la station. Il devrait tout de même se situer aux alentours de… 100 000 dollars.

Une dix-huitième génération de machines

Pour autant, Dell n’est pas encore totalement devenu un simple revendeur de cartes mères Nvidia. Le constructeur a dévoilé lors de sa conférence toute une série de machines, pareillement appelées AI Factory, mais de sa conception et basées sur des architectures plus traditionnelles.

Dans les stations de travail, les utilisateurs qui n’auront pas les moyens de s’offrir la Dell Pro Max pourront se retourner vers la nouvelle Dell Pro Precision 9, une machine au format tour basée sur le dernier processeur Xeon 600 qu’Intel a spécialement développé pour les stations d’IA.

La Dell Pro Precision 9 existe en trois modèles (T2, T4, T6) capables d’intégrer plus ou moins de GPU. La version T6 sera vendue avec des Xeon 600 comprenant de 18 à 86 cœurs, jusqu’à 4 To de RAM DDR5 et soit deux GPU consommant chacun 600 W, soit 5 GPU de 300 W chacun. La T4, dans un boîtier plus fin, ne supporte qu’un GPU de 600 W ou deux de 300 Watts. La T2, dans un boîtier moins haut, fait de même, mais le Xeon 600 est limité à 24 cœurs et la mémoire à 1 To.

Toutes ces stations sont regroupées dans une nouvelle famille appelée Dell Deskside Agentic AI. Selon Dell, les Pro Precision 9 servent à exécuter des modèles d’IA de 30 à 200 milliards de paramètres, tandis que la Pro Max pourrait grimper jusqu’à des modèles de 1 000 milliards de paramètres.  

Côté serveurs, il s’agit pour Dell d’inaugurer lors de cette conférence sa dix-huitième génération de machines PowerEdge avec une vingtaine de modèles. En plus du XE9812 cité plus haut, on retiendra l’annonce des PowerEdge suivants :

  • M9825 : haut de gamme refroidi à l’eau (donc ultra fin, potentiellement 1U) et basé sur des processeurs Epyc de sixième génération, qu’AMD devrait dévoiler en juillet prochain. A priori, cette machine sera réservée aux supercalculateurs
  • XE7845 et XE5845 : des machines racks pouvant atteindre 8U de hauteur, refroidies par air, avec deux ou quatre processeurs et intégrant jusqu’à 8 GPU au format PCIe.
  • RE9825 et RE9815 : également basés sur les prochains Epyc 6 d’AMD qui contiendront 128 cœurs, avec, respectivement, deux processeurs dans un boîtier 3U (256 cœurs) et un processeur dans un boîtier 2U.  
  • R9810 : l’équivalent du RE9815, mais cette fois-ci avec un processeur Xeon 7 Diamond Rapids qu’Intel lancera plus tard cette année, avec 50 % de cœurs en plus et deux fois plus de bande passante.

À partir du moment où ces machines seront siglées Dell AI Factory, elles seront livrées avec un logiciel Data Orchestration Engine, qui est une sorte d’usine pour convertir en continu les documents (bureautiques, multimédia, etc.) en données prêtes à l’emploi pour l’inférence, sans avoir a priori besoin de passer par des data scientists pour faire les réglages. À première vue, cette suite Data Orchestration Engine reposera sur la suite AI Enterprise de Nvidia, mais elle pourrait aussi utiliser Red Hat AI de Red Hat pour les configurations qui n’utiliseront pas de GPU Nvidia.

Pour approfondir sur x86