Hardware IA (GPU, FPGA, etc.)

Actualités 20 oct. 2025
NetApp et Intel présentent l’appliance d’IA d’appoint AIPod Mini

La petite machine se veut une solution immédiatement utilisable, rapide, sécurisée et économiquement avantageuse, pour exécuter sur site des IA qui tiennent compte des données privées des entreprises. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 17 oct. 2025
IA souveraine : T-Systems achète 10 000 GPU à NVIDIA pour un cloud européen

Les deux groupes ont annoncé la création d’une infrastructure européenne, hébergée en Allemagne, dédiée à l’intelligence artificielle. Sa mise en service est prévue pour 2026. Lire la suite
par
- Yann Serra, LeMagIT
- Philippe Ducellier, Rédacteur en chef adjoint

Ressources Partenaire

Télécharger Information Sécurité

Dans ce numéro:
- Anssi : des cyberattaques qui en feraient oublier les défauts de sécurisation
- Comment choisir un EDR ?
- Contourner l’EDR ? Miser sur des objets connectés non supervisés
Télécharger cette édition

Actualités 16 oct. 2025
Oracle adapte son réseau pour gérer des HPC de plus de 130 000 GPU

Avec Acceleron, Oracle veut interconnecter les salles et les bâtiments bardés de rack GPU dans ses data centers, tout en économisant de l’espace et l’énergie consommée par le réseau, pour ajouter davantage de puces IA. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 16 oct. 2025
Intel relance ses GPU, mais juste pour l’inférence

Intel présente un design de cluster de calcul pour l’IA similaire aux DGX NVL72 de Nvidia, qui ne permet pas d’entraîner des AI, mais consomme moins d’énergie pour les utiliser. Il est basé sur sa puce Gaudi3. Lire la suite
par
- Yann Serra, LeMagIT
Guide 10 oct. 2025
IA : le guide des équipements serveur pour votre datacenter

Plateformes prêtes à l’emploi, clusters de serveurs, GPU… Ce guide présente les solutions d’infrastructure du moment pour exécuter les calculs de vos intelligences artificielles. Mais attention : un risque de pénurie les guette. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 07 oct. 2025
Datacenters IA : OpenAI va acheter pour 6 GW de GPU à AMD

L’éditeur de ChatGPT s’était précédemment engagé à acheter l’équivalent de 10 GW de puissance électrique en GPU au concurrent Nvidia. La dépense totale en puces d’IA est estimée à 500 milliards de dollars. Une somme qu’OpenAI n’a pas. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 06 oct. 2025
Granite 4.0 : IBM veut écraser la concurrence sur le terrain de l’inférence

Le géant de l’IT hybride les techniques, pour obtenir des SLM et des LLM plutôt performants et peu gourmands. Il oriente également leur entraînement vers l’IA agentique, quitte à perdre en transparence. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 02 oct. 2025
Taiwan refuse de partager la production de puces d’IA avec les USA

Alors que le gouvernement des USA se targue de négocier avec Taiwan le transfert sur son sol de la moitié de la production des puces de TSMC, la vice-première ministre taiwanaise rétorque qu’elle n’était pas au courant et qu’elle s’oppose même à une telle idée. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 23 sept. 2025
Nvidia : l’étrange investissement de 100 milliards à la faveur d’OpenAI

Cet investissement doit permettre à OpenAI de déployer des millions de GPU nécessaires au fonctionnement de son IA GPT. Ce déploiement se fera dans des datacenters avec lesquels Nvidia passe aussi des accords, au bénéfice de son action en bourse. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 22 sept. 2025
LLM-as-a-Service : Scaleway propose ses services d’inférence depuis Hugging Face

Jusqu’alors, Hugging Face avait connecté sa plateforme avec les services d’inférence de néocloud. Scaleway est le premier fournisseur français à se connecter à la bibliothèque de modèles d’IA open weight. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 22 sept. 2025
Infrastructure IA : Nvidia rachète Enfabrica

Le contrôleur CXL de la startup doit permettre à plusieurs GPU de partager une extension mémoire externe, accélérant l’entraînement des IA et rendant plus élastique l’inférence. Étonnamment, cette extension serait reliée par Ethernet. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 18 sept. 2025
Puces IA : la Chine ne veut plus de Nvidia

Dans la guerre économique qui l’oppose aux USA, la Chine a décidé de ne plus dépendre des GPU américains, d’autant que son champion Huawei a désormais des solutions pour développer ses IA. Nvidia accuse le coup. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 17 sept. 2025
Chez HPE, les ventes de serveurs progressent aussi

Comme Dell, HPE se félicite du succès de ses nouvelles machines configurées pour l’IA dans les datacenters. Une dynamique que tardent à suivre les solutions de stockage. Comme partout ailleurs. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 15 sept. 2025
Puces IA : SK Hynix lance la production des mémoires HBM4

Ce nouveau type de mémoire contribuera aux deux tiers des gains de performances qu’afficheront les prochains GPU. Pour SK Hynix, il s’agit surtout d’une avancée considérable face à Samsung, l’actuel leader des composants mémoires. Lire la suite
par
- Yann Serra, LeMagIT
12 sept. 2025

Avec Mistral AI, Nvidia s’affiche en fer de lance de l’IA souveraine

Lire la suite
Actualités 10 sept. 2025
Puces IA : Nvidia dévoile le Rubin CPX pour l’inférence

Le constructeur a dévoilé les caractéristiques probables du GPU qu’il lancera d’ici à la fin de l’année 2026 pour accélérer l’inférence. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 08 sept. 2025
Le Sénat américain propose d’interdire la vente de GPU en Europe

Une proposition de loi suggère que le barème TPP, qui empêche les GPU classiques d’entrer en Chine, s’applique à l’ensemble du monde. L’Europe serait dès lors condamnée à utiliser les services des hyperscalers américains pour travailler avec l’IA. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 27 août 2025
Nvidia commercialise son GPU Blackwell pour PME

Le GPU RTX Pro 6000 Blackwell Server Edition permet au tout venant des entreprises de bénéficier dans leur salle informatique, sur des serveurs d’appoint, de la puissance en IA des grands datacenters. Lire la suite
par
- Yann Serra, LeMagIT
- Shane Snider, Senior News Writer
Guide 25 août 2025
Dossier : comment les USA régulent le marché des puces pour l’IA

Ce dossier répertorie toutes les clés pour comprendre la stratégie étatsunienne en matière de semiconducteurs de pointe. Les USA veulent en réglementer le commerce et s’en servir pour conforter leur suprématie en intelligence artificielle. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 22 août 2025
Empreinte écologique de l'IA générative : Google tente d’éteindre le feu

Dans un billet technique, Google affirme que l’empreinte énergétique de son IA générative Gemini serait largement inférieure aux estimations publiques alarmistes. Google y détaille sa méthodologie de calcul et revendique des gains d’efficacité sur les douze derniers mois. Mais la transparence n’est pas encore là. Lire la suite
par
- Philippe Ducellier, Rédacteur en chef adjoint
Actualités 14 août 2025
Cosmos : Nvidia parie sur l’application de l’IA dans le monde physique

Avec ses modèles de monde Cosmos, le spécialiste fabless des GPU et de l’IA entend favoriser le développement de systèmes robotiques capables de planifier et d’exécuter des tâches de manière autonome. Lire la suite
par
- Esther Shittu, News Writer
- Gaétan Raoul, LeMagIT
Actualités 12 août 2025
AMD et Nvidia reverseront 15 % de leurs revenus engrangés en Chine à l’Administration américaine

Cette mesure sans précédent prise par l’Administration Trump pourrait entrer en conflit avec les dispositions de la Constitution américaine interdisant les taxes à l’exportation. Lire la suite
par
- Shane Snider, Senior News Writer
- La Rédaction
Actualités 08 août 2025
Donald Trump veut imposer 100 % de droits de douane sur les semiconducteurs

Le secteur des puces électroniques est bouleversé par les projets de l’Administration américaine d’imposer des droits de douane sur les semiconducteurs importés aux États-Unis. Lire la suite
par
- Cliff Saran, TechTarget - ComputerWeekly
Actualités 01 août 2025
OpenAI lance un Stargate norvégien sur fond de divorce avec Microsoft

D’ici à fin 2026, OpenAI fera héberger son IA GPT sur les 100 000 GPUs d’un datacenter au nord du continent, bâti par Nscale et Aker pour tout à fait autre chose. Mais pour OpenAI, il y a l’enjeu de maintenir une présence en Europe en dehors des datacenters d’Azure. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 29 juil. 2025
IA : Huawei dévoile son cluster de calcul rival de Nvidia

Le CloudMatrix 384 occupe 16 fois plus d’espace au sol et consomme 5 fois plus d’électricité que le DGX B200 NVL72 de Nvidia. Mais il est 70 % plus performant, permet d’entraîner des modèles 3,6 fois plus complexes et se contente d’un refroidissement par air. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 29 juil. 2025
L’inférence distribuée, l’avenir de Red Hat AI

Red Hat, filiale d’IBM, croit qu’elle a un rôle à jouer dans le déploiement de systèmes hybrides d’IA. Outre la commercialisation de vLLM, l’éditeur mise sur le projet d’inférence IA distribuée, llm-d. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 23 juil. 2025
L’Administration Trump lance un nouveau plan pour l’IA

Il n’est plus question de Stargate. Le nouveau plan d’action américain pour l’IA tout juste dévoilé par l’administration Trump vise à déréguler les chantiers de datacenters aux USA et à réglementer l’IA selon ses objectifs pour le reste du monde. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 23 juil. 2025
Bilan environnemental des LLM : ce que révèle l’étude de Mistral AI

Le fournisseur de LLM français entend offrir davantage de transparence à ses clients en commençant par l’analyse du cycle de vie de son plus gros LLM, Mistral Large 2. L’exercice met en lumière les défauts des estimations des concurrents… et de celles de Mistral AI. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 23 juil. 2025
Infrastructures IA : OpenAI signe des contrats qui jettent le flou sur Stargate

L’éditeur de ChatGPT, au cœur du projet Stargate pour la suprématie des USA en intelligence artificielle, semble faire le tour des hébergeurs américains pour son propre compte et lance des chantiers de datacenters étiquetés Stargate au Moyen-Orient. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 21 juil. 2025
On-premise, edge, multicloud : Clarifai veut unifier l’inférence des modèles d’IA

L’expert de la computer vision s’appuie sur sa plateforme afin de proposer un centre de contrôle des modèles d’IA générative et des agents IA. Son atout majeur ? La possibilité de déployer des charges de travail sur site, dans plusieurs clouds et en local depuis une seule interface Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 16 juil. 2025
Semiconducteurs : de retour en Chine, Nvidia affiche son double jeu

Le fabricant de GPU a de nouveau le droit de vendre ses accélérateurs H20 pour entraîner les IA chinoises. D’un côté, Jensen Huang dit œuvrer au succès américain face à Huawei. De l’autre, il fait tout pour que Tencent, Alibaba et ByteDance rivalisent avec les IA occidentales. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 11 juil. 2025
Infrastructure IA : l’onde de choc CoreWeave

Autrefois mineur de cryptomonnaies, le fournisseur CoreWeave a pris la vague de l’IA générative. Une vague qui fait désormais déferler ses services « GPU on demand » jusque sur les côtes européennes. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 10 juil. 2025
Groq déploie son cloud et ses serveurs d’inférence IA en Europe

Groq installe ses serveurs d’inférence IA et sa plateforme logicielle dans un data center appartenant à Equinix à Helsinki, en Finlande. Le fournisseur espère ainsi convaincre les entreprises européennes d’adopter ses services. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 09 juil. 2025
Photons + neurones : un duo franco-québécois à la conquête de l’IA quantique

La pépite française spécialiste du calcul photonique, Quandela s’allie à l’Institut québécois d’intelligence artificielle (Mila) pour développer des solutions qui combineront IA et informatique quantique. Un moyen également pour Quandela de continuer son implantation internationale au Canada. Lire la suite
par
- Philippe Ducellier, Rédacteur en chef adjoint
Actualités 08 juil. 2025
IA : Phison utilise la capacité des SSD pour étendre la RAM des GPU

Avec ses logiciels aiDaptive+ et ses SSD PASCARI, Phison permet à de simples machines personnelles d’accéder à des fonctions de pointe jusqu’ici réservées aux datacenters, notamment le fine-tuning de grands modèles. Lire la suite
par
- Stéphane Larcher, LeMagIT
- Yann Serra, LeMagIT
Actualités 02 juil. 2025
IA locale : Microsoft veut confier le paramétrage de Windows 11 à un SLM

Le petit modèle de langage Mu (à peine 330 millions de paramètres) a été entraîné pour effectuer de petites tâches en local, sur un NPU. Par exemple, pour régler les options de Windows 11. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 25 juin 2025
IA privée et « souveraine » : Teradata lance AI Factory

Pour les entreprises préoccupées par le contrôle des coûts du cloud et la souveraineté des données, la nouvelle plateforme du fournisseur de longue date promet aux utilisateurs de construire des outils d’IA avancés au sein de leurs propres systèmes. Lire la suite
par
- Gaétan Raoul, LeMagIT
- Eric Avidon, TechTarget
Guide 20 juin 2025
Dossier infrastructure : l’essentiel de Dell Tech World 2025

Surfant sur la nécessité d’utiliser l’IA dans des datacenters privés, le constructeur a multiplié lors de sa dernière conférence mondiale les approches originales pour se passer des infrastructures des hyperscalers. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 17 juin 2025
IA : la CNCF entrevoit une alternative ouverte à CUDA de Nvidia

Les leaders de l’open source soulignent les avancées de projets tels que OpenTelemetry et discutent du rôle de la communauté open source, dans l’élaboration de l’avenir des charges de travail d’intelligence artificielle et dans la promotion de la collaboration mondiale dans un contexte de tensions géopolitiques. Lire la suite
par
- Aaron Tan, Informa TechTarget
- Gaétan Raoul, LeMagIT
17 juin 2025

Infrastructure IA : Nvidia adapte son réseau rapide Spectrum-X au stockage

Lire la suite
E-Zine 17 juin 2025

Storage 40 – Stockage accéléré : les dernières solutions pour épauler l’IA

Dans ce nouveau numéro, Storage explore les dernières solutions de stockage accéléré pour répondre aux exigences de l’IA. Le magazine met en lumière les innovations, les performances extrêmes et stratégies hybrides des acteurs majeurs comme Nvidia, Huawei, Pure Storage, Hammerspace ou Scality. Lire la suite
Actualités 16 juin 2025
Réseau pour grands calculs : UALink 1.0 se dévoile

Les hyperscalers et les entreprises veulent pouvoir router leurs traitements dans les clusters de GPU en passant par autre chose que le système NVLink propriétaire de Nvidia. UALink est la réponse d’un consortium de fournisseurs. Lire la suite
par
- Stéphane Larcher, LeMagIT
Actualités 16 juin 2025
IA agentique : Datadog jauge l’intérêt des clients

Lors de son événement DASH 2025, Datadog a sans surprise mis l’accent sur ses annonces dédiées à l’IA générative et agentique. Hormis ses assistants IA, beaucoup de fonctionnalités sont encore en préversion. De fait, ses clients sont tiraillés quant à leur stratégie IA, tandis que l’éditeur n’a pas fixé la tarification de ses agents IA. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 16 juin 2025
Le cloud OCI achète déjà 130 000 exemplaires du dernier GPU d’AMD

Oracle revendique que son cloud public sera le premier à proposer des services d’IA basés sur le MI355X. Ils seront deux fois moins chers que ceux motorisés par des GPU Nvidia. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 13 juin 2025
Puces pour l’IA : AMD dévoile son GPU MI350X

Le constructeur prétend lancer la meilleure alternative aux GPU Blackwell de Nvidia. Son GPU MI350X peut charger des LLM de plus grande taille qu’un B200, avec une précision de 6 bits inédite qui autorise de meilleurs compromis en inférence. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 12 juin 2025
Avec Mistral AI, Nvidia s’affiche en fer de lance de l’IA souveraine

En soutenant l’IA souveraine, Nvidia entend bien maintenir son quasi-monopole en Europe dans la fourniture d’infrastructures dédiées à l’IA, et plus largement à la simulation par ordinateur. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 10 juin 2025
« From Chip to Cloud » et vice-versa : la stratégie de Microsoft en matière d’IA locale

Pour Microsoft, l’IA générative et agentique est un coup de fouet à la vente d’ordinateurs en entreprise. Peu importe le form factor, le chipset qui le propulse, l’appareil confié aux collaborateurs doit être prêt pour l’IA. Car les modèles de langage et de machine learning ne sont pas voués à rester sur le cloud. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 10 juin 2025
Untether AI, Brium et Enosemi : les rachats d’AMD pour rattraper Nvidia

Si Enosemi ne doit servir qu’à perfectionner les réseaux d’entraînement de LLM en datacenters, les deux autres startups permettront à AMD de progresser significativement dans l’optimisation des IA pour les entreprises. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 06 juin 2025
Semiconducteurs : Les USA réduisent la voilure du CHIPS Act

L’administration Trump annonce revoir à la baisse les subventions déjà consenties dans le cadre de ce plan d’investissement de 52,7 milliards de dollars, voté sous Joe Biden pour relancer l’industrie des semiconducteurs sur le sol américain. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 03 juin 2025
Puces IA : EnCharge AI lance une alternative à Qualcomm

Dans la catégorie des accélérateurs pour PC, la puce EN100 de la startup américaine n’est pas intrinsèquement plus puissante que le Cloud AI 100 de Qualcomm, mais elle est beaucoup moins énergivore. Ce qui permet de pousser sa fréquence. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 23 mai 2025
Michael Dell milite pour l’essor des IA privées

Le patron de Dell estime que trop de fournisseurs informatiques travaillent à équiper les centres de calcul géants. Selon lui, les entreprises préfèrent déployer une IA personnalisée, d’appoint, entre leurs murs. Lire la suite
par
- Yann Serra, LeMagIT
- Tim McCarthy, News Writer
Actualités 21 mai 2025
PC : Dell dévoile une gamme pour l’IA de pointe sur le bureau

Les nouvelles stations portables Dell Pro Max AI devraient arriver d’ici à la fin de l’année avec la capacité d’utiliser gratuitement, sans passer par le cloud, des LLM de 30 à 109 milliards de paramètres, selon la configuration. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 20 mai 2025
Nvidia interconnecte les GPU des hyperscalers avec DGX Cloud Lepton

Nouvelle mouture du courtier Lepton AI racheté en avril dernier, le service en ligne permet à Nvidia de commercialiser des clusters de calcul virtuels qui n’ont pas de limite de capacité puisqu’ils piochent des ressources chez différents hyperscalers. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 20 mai 2025
Dell dévoile les premiers serveurs Blackwell pour l’entreprise

Allant bien au-delà de l’unique configuration présentée par Nvidia, Dell commercialise des serveurs équipés des derniers GPU B300, qui fonctionnent avec des processeurs x86 traditionnels et peuvent même être refroidis par simple ventilation. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 28 avr. 2025
L’impact énergétique de l’IA, une affaire de données

Lors de la conférence ChangeNow, James Martin (fondateur de BetterTech) et Axelle Lemaire (directrice développement durable chez Sopra Steria) ont réclamé à OpenAI de transmettre les données sur la consommation énergétique réelle de ses services. Un exercice difficile qui transparaît dans un rapport mené par l’agence internationale de l’énergie. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 23 avr. 2025
GPU : Huawei lance ses alternatives aux puces de Nvidia

En Chine, le constructeur va successivement lancer une puce moins puissante que le H100, mais livrée dans des machines plus performantes que les derniers clusters de Nvidia, puis un modèle Ascend 920 qui égale ses performances. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 22 avr. 2025
Cloud souverain : un service Kubernetes chez OUTSCALE

La filiale cloud de Dassault Systèmes renforce son offre souveraine avec « OKS », une offre Kubernetes managée, sur une infrastructure certifiée SecNumCloud. OUTSCALE vise les workloads critiques des entreprises et du secteur public, ainsi que les projets d’Intelligence artificielle. Lire la suite
par
- Philippe Ducellier, Rédacteur en chef adjoint
Actualités 15 avr. 2025
Un accès WAN, un nouveau TPU et de l’IA sur site chez GCP

Les offres d’infrastructure du cloud de Google s’enrichissent d’une appliance hyperconvergée équipée des derniers GPU de Nvidia, pour exécuter localement l’IA Gemini, des puces accélératrices Ironwood et de fibres dédiées. Lire la suite
par
- Yann Serra, LeMagIT
Opinion 11 avr. 2025
Pourquoi Apple Intelligence a besoin d’ouverture

Pour leurs premiers pas, les fonctions d’IA générative de macOS, iOS et iPadOS souffrent d’un éventail de cas d’usage limité. Sans compter l’extension exclusive à ChatGPT et l’absence d’accès à ces fonctions pour les développeurs. Lire la suite
par
- Valéry Rieß-Marchive, Rédacteur en chef
Opinion 10 avr. 2025
Cybersécurité : comment ESET utilise l’IA locale sur PC

Si les PC embarquant de l’intelligence artificielle sont porteurs de promesses, les cas d’utilisation concrets ne sont pas encore très nombreux. ESET se distingue là avec des applications plus concrètes. Lire la suite
par
- Gabe Knuth, Senior analyst
Actualités 07 avr. 2025
Llama 4 : Meta s’inspire de ses concurrents chinois

Le géant des réseaux sociaux met ses moyens importants à profit pour entraîner des LLM dotés d’une architecture Mixture of Experts. Largement inspiré de DeepSeek et Alibaba, le travail effectué n’empêche pas certains reproches concernant les performances des LLM et leur ouverture. Lire la suite
par
- Gaétan Raoul, LeMagIT
Opinion 07 avr. 2025
La sécurité pourrait être le cas d’utilisation dont les PC IA ont besoin

Les PC qui embarquent de l’intelligence artificielle ont eu du mal à trouver un cas d’utilisation parfait, mais le besoin de systèmes de sécurité plus solides sur les postes de travail pour aider. Lire la suite
par
- Gabe Knuth, Senior analyst
Actualités 30 mars 2025
Stockage : les solutions certifiées par Nvidia lors de la GTC 2025

DDN, Dell, HPE, Hitachi Vantara, NetApp, Pure Storage, Vast Data et Weka ont désormais chacun des solutions officiellement compatibles avec les clusters de calcul de nouvelle génération de Nvidia. Lire la suite
par
- Antony Adshead, Storage Editor
Actualités 27 mars 2025
Stations de travail : HP lance des modèles pour l’IA sur site

Le fabricant met à jour ses petites stations graphiques avec des modèles équipés d’une toute nouvelle puce d’AMD, le Ryzen AI Max, un SoC qui reprend les bonnes idées des Mac pour accélérer l’IA. Le public visé va désormais au-delà des professionnels de l’image. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 24 mars 2025
GTC2025 : « Nvidia recentre sa production sur les GPU haut de gamme »

Malgré un catalogue a priori aussi riche qu’auparavant, les nouveaux GPU Blackwell ne seront d’abord disponibles que sur un nombre très limité de modèles. Le très haut de gamme GB200 pour les hyperscalers et des cartes RTX pour le reste du monde. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 19 mars 2025
GTC2025 : Nvidia améliore déjà ses GPU Blackwell

Alors que les modèles B100 et B200 sortent à peine d’usine, le fabricant dévoile déjà un GPU B300 50 % plus rapide. Un système d’orchestration Dynamo, qui optimise leur fonctionnement, et des versions pour stations de travail sont aussi dévoilés. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 14 mars 2025
IA embarquée : Qualcomm rachète Edge Impulse

Qualcomm met la main sur Edge Impulse, l’éditeur californien d’une plateforme d’entraînement et de déploiement de modèles d’IA sur des équipements IoT. Un moyen d’étoffer son portfolio grandissant et de rendre tangible « l’Edge GenAI ». Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 13 mars 2025
Command A : Cohere réduit lui aussi l’empreinte GPU de ses LLM

Le Canadien Cohere a présenté Command A, un modèle de 111 milliards de paramètres. Ce LLM conçu pour s’exécuter sur site tient sur deux GPU Nvidia H100 ou A100 et doit répondre aux besoins des entreprises. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 12 mars 2025
Gemma 3 : Google lance des modèles frugaux dédiés aux développeurs

Les modèles Gemma 3 sont multilingues, multimodaux, traitent plus de données tout en ne réclamant qu’un seul GPU pour s’exécuter. Ce faisant, les équipes de Google DeepMind ciblent les développeurs. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 12 mars 2025
À la rencontre d’Alps, le second plus puissant supercalculateur d’Europe

Dans cette interview, Thomas Schulthess, directeur du CSCS et professeur de physique informatique à l’ETH, explique le développement de l’un des supercalculateurs les plus rapides au monde, l’Alps, déployé sur le sol suisse. Lire la suite
par
- Pat Brans, Pat Brans Associates/Grenoble Ecole de Management
Actualités 06 mars 2025
IA : CoreWeave s’apprête à acquérir Weights & Biases

Dans la foulée de l’annonce de son dépôt de dossier d’introduction en bourse, le spécialiste des infrastructures GPU a annoncé sa volonté d’acquérir Weights & Biases, l’éditeur d’une plateforme de mise en production des modèles d’IA. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 28 févr. 2025
GPT-4.5 : un mastodonte sans avenir chez OpenAI

OpenAI a développé un LLM si gros qu’il a épuisé son lot de puces graphiques pour l’exécuter à large échelle alors que celui-ci ne représente pas un saut générationnel. La licorne pense toutefois que le travail effectué lui permettra de développer des modèles de raisonnement plus performants. Lire la suite
par
- Gaétan Raoul, LeMagIT
Projet IT 27 févr. 2025
Thales : voyage dans une galaxie d’IA de confiance

Au travers de son programme CortAIx, Thales a industrialisé l’intégration de l’intelligence artificielle dans les systèmes critiques, militaires ou civils. La centaine d’applications IA développées concernent notamment la sécurité des mers, la lutte anti-drone ou encore le contrôle aérien. Mais pas que. Plongée dans cette galaxie d’IA aux contraintes très strictes. Lire la suite
par
- Christophe Auffray, LeMagIT
- Stéphane Larcher, LeMagIT
Actualités 26 févr. 2025
IA : les grands modèles consomment jusqu’à 61 000 fois plus d’énergie que les petits

L’AI Energy Score met en évidence l’énorme disparité entre les modèles de deep learning et les grands modèles de langage en matière d’énergie consommée à l’inférence. Un écart global de facteur 61 000 entre les 166 modèles testés, justifié par leur taille, mais aussi leurs différents usages. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 25 févr. 2025
Claude 3.7 Sonnet : Anthropic mise sur un modèle de raisonnement « hybride »

Avec Claude 3.7 Sonnet, Anthropic veut se différencier en proposant un LLM à la fois capable de répondre à des questions et de produire des « raisonnements ». Le fournisseur entend le proposer plus particulièrement aux développeurs. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 19 févr. 2025
Puces IA : les hébergeurs commencent à déployer les GPU d’AMD

Face à la pénurie probable de GPU Nvidia, les opérateurs de clouds privés commencent à proposer des infrastructures d’IA équipées de MI325X, la solution alternative d’AMD. Aux USA, Vultr ouvre la danse. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 18 févr. 2025
Puces IA : dix fournisseurs proposent une alternative à Nvidia

La demande actuelle pour des GPU menace de dépasser les capacités de production de Nvidia. Selon leurs besoins, les entreprises peuvent se tourner vers dix autres fournisseurs. Lire la suite
par
- Yann Serra, LeMagIT
- Devin Partida, ReHack.com
Actualités 17 févr. 2025
Datacenters IA en France : promesses contre promesses

Pour favoriser l’implémentation de nouveaux datacenters IA en France, le gouvernement s’est engagé sur plusieurs fronts : prix et accès préférentiel à l’électricité, identification de sites, et ajustements législatifs. S’il ne promet pas l’impossible, toutes les conditions nécessaires à la réussite de ce plan ne sont pas réunies. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 17 févr. 2025
Puces pour l’IA : la production menace de ne pas suivre la demande

Les États occidentaux ont décidé d’investir des milliards pour déployer sur leurs territoires d’immenses quantités de GPU, tandis que les géants d’Internet réservent en avance la majorité de la production de Nvidia. Pendant ce temps, les usines ne fabriquent pas plus. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 13 févr. 2025
À Amsterdam, Cisco veut redevenir un leader de l’infrastructure

L’équipementier réseau arrive avec des architectures tout-en-un pour l’IA. Outre des switches Ethernet intégrant des accélérateurs de fonctions, il se relance surtout dans les serveurs, avec des configurations simples pour utiliser l’IA en entreprise. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 12 févr. 2025
Compétition et IA : les hyperscalers ont-ils pipé les dés ?

En nouant des partenariats avec les startups, les hyperscalers américains auraient déjà pris les rênes du marché de l’IA, s’alarment les ONG AI Now et Open Market Institute. Les autorités de la concurrence sont plus mesurées, mais vigilantes. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 12 févr. 2025
Sommet sur l’IA : la France et l’Union européenne répliquent (à) « Stargate »

Après que la France a annoncé 109 milliards d’euros d’investissements futurs dans des infrastructures d’IA sur son territoire, c’est au tour de la Commission européenne de « mobiliser » jusqu’à 200 milliards d’euros. Des investissements majoritairement étrangers, qui impliquent une application « favorable à l’innovation » des réglementations. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 10 févr. 2025
Sommet sur l’IA : les étoiles s’alignent pour Mistral AI

Bien conscient du souffle que représente le sommet international pour l’action sur l’IA, Mistral AI déploie la grand-voile et multiplie les annonces. La jeune pousse dirigée par Arthur Mensch bénéficie désormais du soutien gouvernemental et des grands comptes tout en rivalisant avec OpenAI aux yeux du grand public. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 10 févr. 2025
MLPerf : des tests pour mesurer objectivement les offres d’IA

Développés par l’organisation à but non lucratif MLCommons, ces benchmarks évaluent les performances des infrastructures vendues pour entraîner ou inférer des IA. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 06 févr. 2025
Infrastructure IA : Nvidia adapte son réseau rapide Spectrum-X au stockage

Les switches et les cartes réseau de Nvidia disposent d’un mode d’accélération propriétaire qui ne fonctionnait jusque-là qu’entre des serveurs de calcul. Désormais, ce mode Spectrum-X est utilisable avec les baies de stockage. DDN, Vast et Weka l’ont validé. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 05 févr. 2025
Cerebras promeut sa puce IA via un chatbot DeepSeek R1 plus rapide

En quête de visibilité pour son processeur géant WSE-3, le concepteur de semiconducteurs américain propose lui aussi en ligne un chatbot gratuit pour utiliser le LLM chinois, mais avec des réponses plus rapides qu’ailleurs. Lire la suite
par
- Yann Serra, LeMagIT
Conseil 04 févr. 2025
Tout comprendre à DeepSeek : les faits derrière le « buzz »

Le lancement des modèles de DeepSeek R1 et V3 ainsi que la réaction des investisseurs ont fait beaucoup de bruits ces deux dernières semaines. Ce bruit génère des questions que LeMagIT a rassemblées ici en tentant d’y répondre le mieux possible. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 03 févr. 2025
« Guerre » des LLM : OpenAI riposte avec o3-mini et deep research

OpenAI a lancé o3-mini, un modèle de raisonnement « low-cost », ainsi que deep research, un agent consacré aux recherches Web les plus complexes. Des LLM qui justifieraient des investissements massifs en puissance de calcul, selon le directeur scientifique de la startup. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 30 janv. 2025
Small 3 : Mistral AI a son équivalent de GPT-4o mini en local

Relativement petit, rapide, « open weight » et aussi performant que GPT-4o mini. Voilà les arguments principaux de Mistral AI pour vanter les mérites de Mistral Small 3. Lire la suite
par
- Gaétan Raoul, LeMagIT
Conseil 30 janv. 2025
Pourquoi faire tourner une IA sur site ?

La croissance rapide de l’intelligence artificielle est en grande partie due aux outils cloud. Mais il existe de très bonnes raisons d’héberger les workloads d’IA sur site. Lire la suite
par
- Stephen Pritchard
Actualités 29 janv. 2025
Les LLM DeepSeek-R1 et V3 sont « frugaux » à l’entraînement, pas à l’usage

DeepSeek a pu réaliser des économies lors de l’entraînement, mais à l’usage ses modèles R1 et V3 ne sont pas « frugaux », prévient le CEO d’Ekimetrics. Un phénomène qui s’explique par l’architecture choisie par la startup. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 29 janv. 2025
DeepSeek R1 : ces flous qui jettent le doute sur sa conception

Si la startup chinoise a marqué les esprits avec des modèles moins chers à concevoir, il est intéressant de détailler son approche pour y arriver. DeepSeek se montre particulièrement ouverte sur la méthode, mais elle se garde bien de détailler la provenance des données et les traitements opérés. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 24 janv. 2025
Aleph Alpha veut libérer les LLM de leur tokenizer

Aleph Alpha, l’autre pépite européenne de l’IA avec Mistral AI, a présenté lors du forum économique de Davos, une architecture de LLM sans tokenizer. Elle espère ainsi réduire la quantité de ressources de calcul nécessaire à l’entraînement et à l’inférence des modèles. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 15 janv. 2025
IA open source : OpenLLM-France touche du doigt le Graal

Le consortium OpenLLM France dit avoir réussi à entraîner une collection de LLM respectueuse de la définition de l’IA open source par l’Open Source Initiative, tout en tentant de dépasser ce cadre. Un défi de taille quand il faut réunir des milliers de milliards de mots (tokens). Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 14 janv. 2025
Restriction de l’IA dans le monde : Washington s’explique dans une fiche

En à peine quelques heures, les USA ont déjà promulgué un nouveau cadre juridique qui impose des quotas de GPU et de LLM au reste du monde. À une semaine du changement de présidence. Les industriels des semiconducteurs demandent le retrait du texte. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 13 janv. 2025
PC IA : un succès limité en raison de coûts élevés

Les ventes de PC IA sont à la traîne, malgré une hausse des livraisons globales de PC. L’absence de cas d’utilisation convaincants et les prix élevés freinent les renouvellements. Lire la suite
par
- Antone Gonsalves, Director of News
Actualités 10 janv. 2025
Phi-4 : le petit LLM de Microsoft est un dévoreur de données synthétiques

Avec Phi-4, Microsoft fait à nouveau la preuve de l’efficacité des techniques de distillation de connaissances. Son LLM de 14 milliards de paramètres surpasse ou égale ses concurrents, dont Qwen 2.5 72B. Reste à savoir si cette approche de l’entraînement des LLM s’appuyant amplement sur des données synthétiques est durable. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 09 janv. 2025
Intel développe les puces Core Ultra AI dans un contexte de concurrence sur le marché

Les PC équipés des nouvelles puces Core Ultra AI d’Intel destinées au grand public seront commercialisés à partir de février. Les précédentes versions des puces Core Ultra étaient destinées aux PC professionnels. Lire la suite
par
- Antone Gonsalves, Director of News
Actualités 08 janv. 2025
Avec Digits, Nvidia met ses supercalculateurs sur le bureau

Le constructeur présente une machine de bureau contenant une version miniature de l’architecture Grace-Blackwell qui équipera cette année les serveurs d’IA. Elle exécute localement des IA et se présente comme une station pour développeurs. Lire la suite
par
- Yann Serra, LeMagIT
Actualités 07 janv. 2025
NIM : Nvidia adapte ses microservices à l’IA agentique

Le spécialiste des GPU a présenté lors du Consumer Electronics Show 2025 des partenariats et des modèles LLM pour couvrir les cas d’usage liés à l’IA agentique. Il fait surtout un effort pour compresser ses LLM afin de les déployer sur des puces plus abordables. Lire la suite
par
- Gaétan Raoul, LeMagIT
Actualités 24 déc. 2024
ModernBERT : Answer.ai et LightOn acollent un turbo à BERT

En confiant les attributs de l’architecture des LLM à BERT, Answer.ai et LightOn espèrent prouver que ModernBERT a toute sa place dans les systèmes RAG aux côtés des LLM les plus en vogue. Lire la suite
par
- Gaétan Raoul, LeMagIT
Guide 19 déc. 2024
Le guide des annonces d’AWS re:Invent 2024

Ce guide essentiel met en lumière les principales annonces faites par l’hyperscaler AWS lors de son récent événement annuel. Lire la suite
par
- Yann Serra, LeMagIT