lazyllama - stock.adobe.com
Le Sénat américain propose d’interdire la vente de GPU en Europe
Une proposition de loi suggère que le barème TPP, qui empêche les GPU classiques d’entrer en Chine, s’applique à l’ensemble du monde. L’Europe serait dès lors condamnée à utiliser les services des hyperscalers américains pour travailler avec l’IA.
Comme la Chine, l’Europe et les autres alliés des USA risquent bien de ne plus avoir accès aux GPU nécessaires à l’entraînement des IA. C’est une proposition de loi, dit Gain AI Act, que des sénateurs américains viennent de publier et qui vise à favoriser les entreprises, les startups et les universités américaines dans leurs innovations avec l’IA, au détriment du reste du monde.
En substance, toute exportation de puces d’IA américaine devrait désormais faire l’objet d’une demande de licence. Et cette licence ne devrait jamais être accordée s’il s’agit d’une puce dépassant un certain niveau de performances.
Le niveau de performances au-delà duquel une puce IA ne serait plus exportable est fixé à 4800 TPP (Total Processing Power). Dans les faits, tous les GPU conçus pour entraîner des IA en datacenters depuis le Nvidia A100, lancé en 2020, sont concernés.
Si ce texte est voté, l’Europe ne pourrait donc plus jamais importer les GPU haut de gamme de Nvidia et AMD. Ni directement, comme le font OVHcloud, Scaleway, Eviden. Ni indirectement, via l’achat de serveurs américains Dell ou HPE qui en seraient équipés.
En filigrane, l’objectif atteint par cette loi serait que les entreprises européennes n’accéderaient aux GPU les plus puissants qu’en souscrivant aux services d’entraînent des IA des hyperscalers américains. Principalement AWS, Azure, GCP, OCI, CoreWeave. L’innovation en Europe n’en serait que plus inféodée aux règles américaines, annihilant au passage tout effort de souveraineté.
Un barème TPP qui remonte à l’administration Biden
Cette proposition de loi fait suite à un autre texte, l’AI Diffusion Rule, passé à la toute fin de présidence de Joe Biden et qui visait à imposer des quotas d’exportation de GPU américains.
Ce premier texte, en vigueur depuis mai dernier, sépare le monde en trois. Les alliés (dix-huit pays occidentaux, dont la France) ne sont pas limités dans l’importation de GPU, mais ils le sont concernant leur réexportation. L’interdiction absolue d’accès aux GPU au-delà de 4800 TPP s’applique déjà aux ennemis (principalement Chine, Russie, Iran, Corée du Nord). Tous les autres pays sont limités à un quota équivalent à 50 000 GPU H100 tous les deux ans.
Dans le nouveau texte, les pays « alliés » et « autres » seraient dégradés vers la situation actuelle des « ennemis ». Mais pour ces derniers, le Sénat imagine également durcir la situation. L’export de GPU vers les pays ennemis serait désormais interdit à partir d’un niveau de performances de 2400 TPP pour une puce gravée en 5nm.
Il introduit aussi une question de taille physique de la puce : si celle-ci est deux fois plus petite qu’un H20 (le GPU limité que Nvidia exporte actuellement vers la Chine à des fins d’entraînement), alors son plafond de performance sera aussi réduit à 1600 TPP. Cette précaution vise à décourager l’achat de nombreuses petites puces pour atteindre les performances d’une grande.
Selon une fiche 3A090 du Département du Commerce, les TPP équivalent au nombre de TOPS (milliers de milliards d’opérations par seconde, voire TFLOPS s’il y a des opérations avec virgules) le plus élevé dans la documentation du fabricant, mais sans tenir compte de la diffusion (alias sparsity, qui consiste à utiliser deux fois un résultat, ce qui double artificiellement les TOPS) et multiplié par la longueur en bits des instructions utilisées pour atteindre ce TOPS. Pour information, voici les TTP des différents GPU utilisés à l’heure actuelle en datacenters :
- AMD MI355X (2025) : 10 100 TOPS x 6 bits = 60 600 TPP
- AMD MI350X (2025) : 9200 TOPS x 6 bits = 55 200 TPP
- Nvidia B300 (fin 2025) : 13 000 TOPS x 4 bits = 52 000 TPP
- Nvidia B200 (2025) : 9000 TOPS x 4 bits = 36 000 TPP
- AMD MI325X et MI300X (2024 et 2023) : 2610 TOPS x 8 bits = 20 880 TPP
- Nvidia H200 et H100 (2024 et 2022) : 1979 TOPS x 8 bits = 15 832 TPP
- Nvidia RTX Pro 6000 Blackwell (2025) : 2000 TOPS x 4 bits = 8000 TPP
- Huawei Ascend 910C (2025) : 780 TOPS x 8 bits = 6240 TPP (non soumis au règlement US)
- Nvidia L40S (2022) : 733 TOPS x 8 bits = 5864 TPP
- Huawei Ascend 910B (2025) : 640 TOPS x 8 bits = 5120 TPP (non soumis au règlement US)
- Nvidia A100 (2020) : 624 TOPS x 8 bits = 4992 TPP
- Nvidia H20 (2025) : 148 TFLOPS x 16 bits = 2368 TPP
- Nvidia L4 (2023) : 242 TOPS x 8 bits = 1940 TPP
Officiellement, pour éviter que les Américains manquent de GPU
Un point plus étrange de la proposition de loi concerne l’interdiction d’exporter tout GPU américain pour datacenters tant que la demande américaine pour ce GPU n’aurait pas été pleinement satisfaite. Le Sénat américain considère en effet que les dernières générations de puces d’IA pour datacenters sont fabriquées en quantité insuffisantes pour la demande mondiale. De fait, toute exportation d’un GPU en dehors des USA reviendrait à priver de GPU un consommateur américain.
Mais si ces puces pour datacenters sont de toute façon jugées trop puissantes pour être exportables, la question d’attendre pour les exporter ne devrait même pas se poser. Dans une interview accordée à Reuters, un responsable de Nvidia fulmine : « nous ne privons jamais nos clients américains afin de servir le reste du monde. Ce problème n’existe pas ! »
Toujours est-il qu’il y a bien un problème de pénurie de GPU. Selon les estimations du MagIT, cette pénurie a surtout été causée jusqu’à présent par les hyperscalers américains qui préemptent chaque année les trois quarts de la production haut de gamme de Nvidia, avant même que celle-ci soit commercialisée.
En clair, bien avant le reste du monde, ce sont surtout leurs propres géants d’Internet qui privent les entreprises, les startups et les universités états-uniennes d’acheter des GPU pour leurs serveurs. Dès lors, si l’objectif réel de la loi était d’éviter une crise de l’offre aux USA, on s’étonne qu’elle n’ait rien à dire à propos de la voracité des hyperscalers.
Les choix de Nvidia et d’AMD quant à la production de leurs GPU participent aussi de cette pénurie. Ils les font systématiquement fabriquer dans la fonderie de génération la plus récente de TSMC. Celle qui atteint la meilleure finesse de gravure, mais qui n’existe aussi qu’en un seul exemplaire, avec une capacité limitée, et qui essuie les plâtres.
Ainsi, les B200 et B300 sont fabriqués avec une nouvelle précision de 3 nm et un nouveau système CoWOS-L jamais testé auparavant. Le cabinet SemiAnalysis pointe que l’objectif de Nvidia de fabriquer un million de puces par trimestre ne serait atteint que lors de ce second semestre 2025, car il aura fallu plus de six mois à TSMC pour résoudre l’apparition de craquelures sur des circuits, qui ont rendu invendables nombre d’exemplaires dans les premiers lots.
Force est de constater que le Sénat américain préfère légiférer sur l’exportation des GPU plutôt que sur leur production. Une posture qui a jusqu’ici surtout permis à l’administration Trump de prélever de nouvelles taxes. On se souvient en effet que l’interdiction totale d’exporter des GPU vers la Chine a finalement été levée en échange de 15% des revenus générés.