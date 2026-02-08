Intel annonce travailler avec la startup japonaise Saimemory pour développer une nouvelle mémoire dite ZAM (Z-Angle Memory) deux à trois plus dense, a priori plus rapide et 50% moins consommatrice d’énergie que les circuits HBM actuellement intégrés dans les GPU. Des prototypes devraient fonctionner en 2027 et la ZAM pourrait arriver sur le marché en 2030.

L’innovation de Saimemory, qui a été fondée par des chercheurs de l’Université de Tokyo, consiste en une nouvelle façon d’interconnecter des circuits de DRAM empilés les uns sur les autres. Selon une illustration que LeMagIT a pu consulter, les broches qui relient les étages deux à deux ne seraient plus verticales, mais obliques.

En soi, la technologie mise au point par Saimemory n’est pas assez aboutie pour être industrialisable. Mais elle est complémentaire de travaux qu’Intel mène déjà pour densifier les transistors dans une puce. Notamment sa technique de compression thermique (le « bonding ») qui, par des dosages de températures extrêmement précis, permet d’assembler des circuits les uns contre les autres avec plus de proximité que d’ordinaire. Intel a ainsi développé de son côté une mémoire NGDB (New Generation DRAM Bonding) plus dense, mais pas nécessairement moins énergivore que la HBM.

L’enjeu est de placer un maximum de circuits DRAM au plus proche des cœurs qui calculent pour accélérer davantage leurs traitements en IA. Cette proximité sert à éviter les goulets d’étranglement des bus qui relient d’ordinaire un processeur à ses barrettes de DRAM. Gagner en vitesse d’accès est essentiel, car les modèles d’intelligence artificielle comportent des dizaines, voire des centaines de milliards de paramètres, ce qui les rend plus longs à parcourir qu’une base de données classique.

La mémoire HBM y parvient en empilant des circuits de DRAM conventionnels, ce qui permet de suffisamment minimiser la surface physique de la mémoire pour l’intégrer dans la même puce que les cœurs de calcul. Cette proximité sert par ailleurs à directement connecter les broches de la DRAM à un maximum de broches sur la puce de calcul, ce qui maximise les débits en multipliant les liens de communication. Problème, la HBM démultiplie la consommation d’énergie et la dissipation de chaleur de la puce dans laquelle elle prend place.