
zentilia - Fotolia
Infrastructures : le mégaprojet Stargate entretient les mystères
Nombre d’emplois, de datacenters, de dollars… Rien ne semble aller de soi dans les chiffres du projet américain Stargate qui vise à faire des USA une superpuissance mondiale de l’intelligence artificielle.
Une semaine après son annonce, le chantier de Stargate n’est toujours pas clair. Sur le papier, la nouvelle administration Trump annonce un investissement massif en infrastructures d’intelligence artificielle qui projettera les USA loin devant le reste du monde et créera sur son sol 100 000 emplois. Mais, en pratique, la logique qui permettrait d’atteindre les chiffres annoncés – le nombre d’emplois, de datacenters, de dollars – est difficilement compréhensible.
Pour mémoire, le projet Stargate est une entreprise en soi dont le but est d’investir 500 milliards de dollars sur les quatre prochaines années afin de mettre en opération une infrastructure destinée à exécuter et entraîner les modèles d’IA d’OpenAI sur le sol américain. L’infrastructure sera en l’occurrence portée par les technologies d’ARM (qui fournit le design des processeurs), de Nvidia (qui fabrique les puces de calculs GPU), ainsi que de Microsoft et Oracle qui fourniront tous les deux le fonctionnement en cloud.
Les financements initiaux, à savoir les 100 premiers milliards de dollars, seraient apportés par la banque d’affaires japonaise Softbank (qui détient ARM), par la banque d’affaires émiratie MGX, par Oracle et par OpenAI. Masayoshi Son, le PDG de Softbank, dirigera le conseil d’administration de Stargate et une personne d’OpenAI – on ignore à ce stade s’il s’agira de son PDG Sam Altman – dirigera ses opérations en tant que directeur général.
Le déploiement de l’infrastructure Stargate passera par la construction et l’équipement de nouveaux campus de datacenters aux USA. Pour l’heure, un seul campus est en construction à Abilene, au Texas, à un peu plus de 300 km de Dallas. Ce campus, dont le chantier a été lancé dès 2021, héberge pour l’heure deux datacenters et doit en compter huit de plus à terme. D’ici à 2029, les responsables de Stargate espèrent aussi lancer la construction de dix autres datacenters sur le sol américain. Le temps presse, car il faut compter au moins deux ans pour construire un datacenter.
Reste que tous ces éléments sont à mettre en perspective. À commencer par la signification exacte du nombre d’emplois créés.
De quels 100 000 emplois parle-t-on ?
Comparativement, selon le dernier baromètre de France Datacenter, la filière des datacenters en France embauchait 28 000 salariés en 2023 pour 260 sites en colocation. Un point intéressant est que, de manière quasiment invariable, partout dans le monde et quelle que soit l’année, plus de 36 % des emplois directs sont uniquement liés à la construction de ces datacenters.
Le nombre de salariés directement embauchés par la filière des datacenters est à multiplier par environ 1,5 si l’on englobe les salariés des prestataires externes qui contribuent soit à l’équipement des datacenters (fournisseurs), soit à la revente de ses ressources (ESN).
Si l’on rapporte ces proportions aux nombres d’emplois du projet américain, Stargate engendrerait ainsi environ 33 000 nouveaux emplois américains chez les ESN et les fournisseurs, embaucherait un peu plus de 49 000 salariés pour son exploitation (de la maintenance du site à la commercialisation directe de ses ressources) et ferait travailler un peu moins de 18 000 ouvriers le temps de sa construction.
Par ailleurs, la construction des dix datacenters supplémentaires n’ayant même pas commencé – Stargate prospecte encore les différentes administrations locales pour trouver des emplacements – tous ces chiffres sont pour l’instant à diviser par deux si l’on considère que seul le projet du campus texan est à ce jour certain de sortir de terre.
À noter que, pour l’instant, le campus des deux datacenters vides à Abilene embauche 57 personnes chargées de la sécurité du site et la maintenance des infrastructures énergétiques. C’est ce qui avait été annoncé au départ du projet, selon la presse locale, et c’est toujours le cas quatre ans plus tard selon des documents consultés par Bloomberg.
Ces quelques dizaines d’emplois par datacenters sont cohérentes avec les chiffres de France Datacenter qui dénombre un peu plus d’une centaine d’emplois par datacenter en colocation déjà opérationnels. On pourrait ainsi estimer que les 20 datacenters de Stargate créeraient un peu plus de 2 000 emplois directs et un total de 3 000 emplois si l’on ajoute les personnels externes chargés de revendre ses ressources. Le moyen grâce auquel Stargate multiplierait ce nombre par 33 n’est pas très clair.
Qui finance quels montants et comment ?
Un autre point important du projet est le nom de ceux qui participent à son financement et ceux qui en sont pour l’instant exclus. Parmi ces derniers, le milliardaire Elon Musk. Elon Musk était pourtant identifié par les médias comme le no 2 officieux de l’administration Trump et il est aussi le seul au monde à avoir réussi à faire sortir de terre un datacenter Colossus dédié à l’IA, gorgé de 100 000 GPU Nvidia H100, en seulement quatre mois. Celui-ci est situé à Memphis (Tenesse).
Elon Musk ne décolère pas d’avoir été écarté et argumente que Stargate ne pourra pas se faire sans ses investissements. Selon lui, Softbank n’apporterait que 10 milliards de dollars sur les 100 initialement prévus. L’intéressé n’a pas démenti.
On ignore combien Oracle et MGX, les deux autres investisseurs trouvés par Donal Trump, comptent investir dans Stargate. MGX est un fonds d’investissement en intelligence artificielle lancé par le gouvernement d’Abu Dhabi l’année dernière avec un budget total de 100 milliards de dollars, à répartir entre divers projets.
Du côté d’Oracle, il est possible que sa participation financière ne se fasse pas en cash mais en nature. En effet, Oracle est l’actuel exploitant du premier campus d’Alibene. En 2024, ce campus était censé rejoindre la flotte des datacenters d’OCI, le cloud public d’Oracle. Oracle en ferait manifestement cadeau à Stargate.
Le campus d’Alibene ne compte pour l’heure que deux immeubles opérationnels, représentant 200 Mégawatts d’énergie pour accueillir 100 000 GPUs Nvidia H100 refroidis par liquide, comme Colossus. Le site est censé pouvoir supporter 1 Gigawatt d’énergie au total, moyennant la construction de huit bâtiments supplémentaires, mais Oracle n’a a priori pas encore investi dans ce projet.
Précisons que ce n’est pas Oracle qui a financé la construction des deux premiers immeubles de ce campus, mais une co-entreprise formée par le propriétaire de datacenters américain Crusoe et le fonds d’investissement américain Blue Owl Capital. Ensemble, ils ont investi 3,4 mds $ pour construire en un an des murs et des réseaux de distribution d’énergie sur un site où l’équipementier américain Lancium avait déjà construit depuis 2022 une centrale d’énergie au gaz.
L’équipement informatique censé remplir les salles, en revanche, doit être fourni ce semestre par Oracle. Oracle ferait donc don à Stargate de son loyer et de ses machines. Il est heureux que ces machines et leur OS aient été adaptés en juin 2024 pour exécuter l’IA d’OpenAI.
OpenAI, un investisseur clé… sans argent ?
Le quatrième investisseur officiel est OpenAI. Cela dit, malgré une croissance extraordinaire de 250 % d’une année sur l’autre, OpenAI ne devrait pas non plus contribuer beaucoup lui-même au financement de Stargate.
Son CA annuel de 2024 était de seulement 3,7 milliards de dollars. Pire, selon le média indien Economic Times, qui rapporte une étude du cabinet Futurism, OpenAI ne générerait à l’heure actuelle aucun bénéfice qui puisse être réinvesti. Il dépenserait 700 000 dollars par jour pour faire fonctionner ChatGPT sur les infrastructures de Microsoft Azure et d’OCI, soit un déficit d’environ 5 milliards de dollars dans ses caisses pour l’année 2024.
Pour autant, ce serait OpenAI qui aurait convaincu l’administration Trump qu’il existerait actuellement dans le monde un réservoir d’environ 175 milliards de dollars prêts à être investis par des entreprises privées dans l’IA. Dans un manifeste paru en fin d’année dernière, OpenAI défendait l’idée que le gouvernement américain devait l’aider à faire venir ces investissements aux USA plutôt que les laisser partir en Chine.
Le média américain Forbes donne des éléments de contexte. Selon lui, le gouvernement chinois n’aurait pu investir jusqu’ici que 186 milliards de dollars dans ses infrastructures d’IA, mais il comptait jusqu’à l’année dernière se débrouiller pour porter cet investissement à 780 mds $ d’ici à 2030, via des investissements étrangers. En l’occurrence, la Chine serait de moins en moins capable de supporter cette industrie locale seule. Forbes postule qu’empêcher ces investissements privés d’aller enrichir la Chine aurait suffi à convaincre Donald Trump de cautionner Stargate. C’est-à-dire plus pour appauvrir la Chine que pour faire avancer l’IA.
À défaut de financer Stargate sur ses propres finances, OpenAI prétend in fine être capable de collecter des fonds chez des partenaires. Reste à savoir lesquels.
Dans une note de blog, Microsoft, qui parraine le fonctionnement d’OpenAI depuis 2023, explique investir 80 milliards de dollars chaque année dans l’innovation. Et, en 2025, cette somme sera dédiée à la construction de datacenters servant à exécuter de l’IA. Mais, dans une interview accordée à la chaîne américaine CNBC, Satya Nadella, le PDG de Microsoft, refuse de confirmer que ces 80 mds $ seraient consacrés à Stargate, laissant entendre qu’ils financeraient plutôt des projets de datacenters Azure « partout dans le monde ».
Il est à noter qu’OpenAI ne prétend pas seulement parvenir à collecter des fonds. Dans une récente note de blog, il multiplie aussi les emplois que Stargate est censé créer aux USA : « des centaines de milliers », écrit désormais le rédacteur de la note.
Y aura-t-il assez de GPU, de processeurs ARM et de serveurs ?
Un élément également inconnu du projet est la capacité des fournisseurs d’infrastructure pour l’IA à assurer les livraisons d’équipements à Stargate dans un délai de quatre ans. Des tensions sur les stocks de GPU sont à craindre.
Si l’on multiplie les caractéristiques du site actuel d’Alibene pour atteindre les objectifs de Stargate, ce projet cumulera 2 millions de GPUs Nvidia d’ici à 2029. Dans le même temps, les hyperscalers – AWS, Azure, GCP, mais aussi des acteurs issus de pays « alliés » comme le français OVHcloud présent en Amérique du Nord – voudront également s’équiper en GPU. Quant au reste du monde, le récent décret qui limite l’exportation des GPUs semble finalement bien tomber, pour les Américains.
Sur le nombre de GPU haut de gamme pour serveurs, Nvidia serait désormais en mesure, selon diverses sources, d’en produire entre 400 000 et 500 000 par trimestre. En l’occurrence, il faut compter une soixantaine de ces GPU par wafer, mais tous ne sont pas fonctionnels selon la maturité de la chaîne de production de TSMC, l’industriel taiwanais qui grave ces semiconducteurs.
TSMC a une capacité de production actuelle de 150 000 wafers par mois avec la finesse de gravure la plus optimale. Mais ces wafers servent également à produire les processeurs d’AMD, d’Apple, les puces ARM des hyperscalers et les autres GPU de Nvidia.
Selon un palmarès des chiffres publics établi en novembre dernier par le site State of AI, Meta, la maison mère de Facebook, posséderait 350 000 GPU Nvidia haut de gamme pour serveurs (des H100), xAI et Tesla 135 000, Lambda Labs (cloud américain spécialisé en ressources en ligne pour l’IA) 30.000, Google GCP 26 000, Oracle OCI 16 000, le français Scaleway 3000 et Hugging Face 768. AWS, Azure et OVHcloud n’ont pas communiqué sur le nombre de GPU H100 ou H200 qu’ils possèdent.
À cela s’ajoutent les supercalculateurs qui en contiennent moins de 30 000 pour l’Alps (CSCS en Suisse), moins de 5 000 pour le MareNostrum (Espagne), 2 000 pour le Jupiter (Allemagne), ou moins de 1 500 pour le Jean Zay (en France). L’ensemble de ces GPUs a été fourni par Nvidia entre 2023 et 2024.
Un GPU Nvidia de génération précédente (de nos jours les H100) coûte environ 25 000 dollars, tandis qu’un GPU de dernière génération, à la production limitée, coûte plutôt dans les 40 000 dollars. Rien que pour se fournir en GPU, Stargate devra dépenser entre 50 et 80 milliards de dollars, soit un peu plus d’un dixième de son budget.
Au-delà des GPU, il faut aussi compter les processeurs ARM qui servent à les orchestrer, à raison d’un CPU pour deux GPUs, soit un total d’un million de CPU pour Stargate. Trois processeurs seront a priori envisagés : les Grace de Nvidia, les AmpereOne d’Ampere (utilisés dans les machines d’OCI) et les Cobalt d’Azure (qui remplacent actuellement les AmpereOne). Tous sont fabriqués dans les mêmes usines de TSMC. Aucun d’eux n’est à l’heure actuelle fabriqué en assez d’exemplaires pour atteindre une livraison de 250 000 pièces par an.
Reste aussi à savoir si Oracle a les ressources pour assembler autant de machines. Selon le dernier palmarès des ventes de serveurs dans le monde du cabinet Omdia, Oracle investit par an cinq fois moins que Microsoft, quatre fois moins qu’Amazon et Google, ou encore trois fois moins que Meta dans la fabrication de serveurs, toutes configurations confondues.