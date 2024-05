Une ruée vers l’or. Selon le Wall Street Journal, Apple serait en train de développer, lui aussi, une puce accélératrice pour entraîner en un minimum de temps des modèles d’intelligence artificielle dans les datacenters. Si le constructeur à la pomme est bien connu pour mettre au point lui-même les puces ARM de ses iPhone, iPad et Mac, son retour dans les data centers a de quoi surprendre quand on sait qu’il a abandonné toute velléité de travailler sur les serveurs en avril 2022, après l’arrêt de son système macOS Server.

Mais divers observateurs émettent l’hypothèse qu’Apple aurait lui aussi envie de croquer dans ce qui s’annonce comme la plus belle opportunité commerciale de ces six prochaines années : la course au développement de puces accélératrices dédiées à l’IA. Chez Nvidia, l’actuel leader de ce marché, une telle puce, appelée GPU, se vend à l’unité pour environ 40 000 dollars, soit entre 6 et 20 fois plus cher qu’un processeur performant.

L’enjeu économique autour de ces puces est d’autant plus important que les USA sont volontaires pour investir des dizaines de milliards de dollars pour développer sur leur sol une industrie de pointe avant que les Chinois y parviennent. Et l’Union européenne compte faire de même pour ne pas dépendre des USA sur un marché aussi critique.

Outre des chatbots capables de générer des contenus analytiques ou créatifs, qui pourraient enrichir rapidement le commerce de services, l’IA promet en effet de rendre plus efficaces les industriels et les armées. Dans ce contexte, la course au développement des puces les plus efficaces pour les traitements d’IA serait moins un défi technologique qu’une véritable stratégie de géopolitique. Certains n’hésitant pas à parler de guerre froide de l’IA.

Cela dit, Samsung n’est que le numéro 2 de la mémoire HBM, derrière SK Hynix. On ne sait guère plus combien elles pèsent dans les revenus de son activité de fabrication de mémoires, mais SK Hynix indique que ses bénéfices concernant « les puces mémoires pour l’IA, principalement de type HBM » auraient été multipliés par 7,34 rien que sur le dernier trimestre.

On ignore exactement quelle part les mémoires HBM représentent dans les revenus de la filiale de Samsung dédiée aux semiconducteurs. On note cependant que cette dernière lui a rapporté lors du premier trimestre 2024 1,38 milliard de dollars de bénéfices, alors qu’elle n’avait pas été profitable depuis le dernier trimestre de l’année 2022. Et c’est bien sur le seul sujet des mémoires HBM que Samsung a donné un agenda clair, lors de la présentation de ses derniers résultats financiers : la production en masse des mémoires HBM3e en huit couches (24 Go par circuit) débute ce mois et celle des modèles en 12 couches (36 Go par circuit) sera lancée avant cet été.

En version HBM3, ces mémoires fournissent des débits en lecture/écriture de 819 Go/s et coûtent, au Go, cinq fois plus cher que les dernières mémoires DDR5 conçues pour accompagner les processeurs des serveurs.

Parmi 23 mds $ générés par la vente de puces dédiées à l’IA en 2023, 13,5 mds $ de revenus ont été encaissés par l’Américain Nvidia. Ce constructeur ayant eu l’année dernière une situation de quasi-monopole sur la fabrication de GPU – principalement ses modèles H100 et L40S, ainsi que les modèles précédents A100 et L4 –, les 9,5 milliards restants sont surtout réalisés par ses fournisseurs. En l’occurrence les Coréens Samsung et SK Hynix qui fabriquent les mémoires HBM essentielles à l’efficacité de ses GPU.

AMD, Intel et Apple misent aussi sur la mémoire HBM

Selon les renseignements que LeMagIT a pu obtenir, Nvidia devrait commander cette année pour environ 7,3 milliards de dollars de mémoires HBM3, principalement des HBM3e 12 couches pour mettre dans ses prochaines puces B100 et B200.

Samsung et SK Hynix vendent aussi ces mémoires à Apple, pour ses puces Silicon (M1, M2, M3...) et, désormais à Intel et AMD. Ceux-ci ont fermement l’intention de compter parmi les fournisseurs de GPUs pour l’IA, respectivement avec leurs puces Gaudi3 et MI300. On sait déjà qu’AMD entend lancer d’ici à la fin de l’année des versions MI350 et MI375 améliorées.

On ne sait pas encore quels sont les plans d’Apple concernant son futur GPU, baptisé pour l’heure ACDC (Apple Chips in Data Center). Le constructeur argumente que ses Mac seraient, selon des tests internes, les plus performants des ordinateurs personnels pour exécuter des traitements d’inférence localement (notamment via un outil tel que Ollama qui permet de télécharger gratuitement des modèles d’IA sur la machine).

Des chiffres sont avancés : un traitement effectué en 6 heures sur un PC équipé d’une carte graphique Titan X haut de gamme de Nvidia s’exécuterait en à peine 50 minutes sur un Mac doté du dernier processeur M3. Ce comparatif est censé donner une idée de l’échelle de performances qu’atteindrait un processeur Apple Silicon pour serveurs par rapport à un GPU H100 ou B200 de Nvidia.

La vitesse des Mac serait notamment due à la capacité du GPU intégré au processeur d’accéder à l’intégralité de la RAM de la machine. De fait, celle-ci est incarnée par une mémoire HBM au centre du processeur. Nvidia planche sur un modèle, la carte GB200, qui doit aussi mieux partager sa mémoire entre deux GPU et Grace, son processeur ARM. AMD a pour sa part déjà dévoilé une déclinaison de son GPU MI300X, la puce MI300A, qui intégrerait comme Apple le GPU et le processeur sur le même circuit, autour d’une mémoire HBM commune.