Hardware IA (GPU, FPGA, etc.)
-
Actualités
25 mars 2026
Bleu : une PaaS IA souveraine en 2027
Jean Coumaros, président de Bleu, a détaillé la feuille de route IA du nouveau cloud souverain. Il propose aujourd’hui des GPU à la demande (IaaS). Des services PaaS les compléteront dès l’arrivée de Microsoft Foundry sur son architecture. Lire la suite
-
Guide
24 mars 2026
Dossier GTC 2026 : tout ce qu’il faut savoir des dernières infrastructures Nvidia
Nvidia fabrique désormais une multitude de machines prêtes à l’emploi que les fournisseurs habituels n’ont plus qu’à revendre. Ce dossier en donne les caractéristiques et les axes de développement. Lire la suite
- Les cyberattaques de 2026 ne ressemblent plus à celles d'hier –Etude
- NIS 2 et au-delà: risques, avantages et conformité –Etude
- Éviter les pertes informatiques grâce à des solutions Zero Trust? –Etude
-
Dans ce numéro:
- Comment calculer le ROI de la cybersécurité pour le PDG et le conseil d’administration
- Ready for IT : quel ROI pour la cybersécurité ?
- Mettre en œuvre une stratégie de sécurité basée sur les risques en 5 étapes
-
Actualités
22 mars 2026
Des membres de Supermicro accusés d’avoir détourné des GPU Nvidia
Le président du constructeur américain et deux complices auraient frauduleusement expédié vers la Chine l’équivalent de 2,5 milliards de dollars en serveurs d’IA. Lire la suite
-
Actualités
22 mars 2026
PDG de Nvidia : « nous atteindrons un CA de 1000 milliards de dollars en 2027 »
En marge de la conférence annuelle GTC 2026, Jensen Huang s’est livré en comité réduit à des confidences sur sa stratégie et ses objectifs. Selon lui, 2026 est l’année charnière entre l’entraînement des IA en cloud et son inférence sur les sites des entreprises. Lire la suite
-
Actualités
20 mars 2026
GTC 2026 : Nvidia met la puissance de ses serveurs dans une station
La nouvelle DGX Station est une machine qui tient dans un boîtier tour ATX et qui est censée permettre à une équipe de faire localement, sans frais supplémentaires, tout ce qu’elle ferait en ligne avec des services d’IA exécutés sur serveur DGX GB300. Lire la suite
-
Actualités
17 mars 2026
GTC 2026 : maintenant, Nvidia part à la conquête des serveurs
Le numéro 1 des puces accélératrices pour l’IA a ouvert son salon annuel avec la présentation de serveurs prêts à l’emploi, dépourvus de ses derniers GPU Rubin, mais servant tout de même à exécuter des IA. Les autres fabricants de serveurs sont priés d’acheter des licences. Lire la suite
-
Actualités
16 mars 2026
La puce géante de Cerebras motorisera les IA d’AWS
L’hyperscaler américain utilisera l’accélérateur WSE-3 d’une puissance de 125 pétaflops pour seconder ses propres puces Trainium3 dans ses services d’IA générative. La répartition des calculs entre les deux composants, appelée inférence désagrégée, est inédite. Lire la suite
-
Actualités
12 mars 2026
IA : Nvidia investit 2 milliards dans Nebius pour qu’il lui achète des puces
Le neocloud profitera de ce financement pour déployer 5 GW de puissance de calcul d’ici à 2030. L’argent que Nvidia met dans ses propres clients a pour conséquence de booster les actions en bourse, alors que la crainte d’une bulle financière existe. Lire la suite
-
Actualités
09 mars 2026
IA : une nouvelle loi pour asseoir la suprématie des USA
Le gouvernement étatsunien planche sur un nouveau texte dans lequel plus aucun pays n’aurait le droit d’acheter des puces accélératrices sans lui demander son accord et sans investir sur le sol américain. Lire la suite
-
Opinion
05 mars 2026
Neoclouds : que vont-ils changer aux GPU-as-a-Service ?
Les neoclouds vont transformer le monde de l’IA à la demande. D’ici 2030, ils devraient capter environ 20 % d’un marché évalué à 267 milliards $, dominé par les hyperscalers qui montrent cependant certaines limites quand il s’agit des workloads spécifiques à l’IA, note Gartner. Lire la suite
par- Mike Dorosh, Gartner
-
Actualités
03 mars 2026
IA générative : Helikai et FuriosaAI proposent un serveur tout-en-un
L’Américain Helikai a mis au point une plateforme logicielle complète pour le RAG, l’inférence selon les secteurs d’activité et la modélisation de processus métiers assistés par des IA. Il la vend dans un serveur doté des accélérateurs du Coréen FuriosaAI. Lire la suite
-
Actualités
27 févr. 2026
OpenAI annonce une levée de fonds de 110 milliards de dollars auprès d’Amazon, Nvidia et Softbank
Amazon à lui seul prévoit d’investir 50 milliards de dollars dans la société dirigée par Sam Altman. Il gagne ainsi l’exclusivité d’OpenAI Frontier et co-entraînera, entre autres, des modèles d’IA infusés dans sa plateforme d’e-commerce. OpenAI sécurise ses finances et une forme d’indépendance envers Microsoft et Nvidia. Lire la suite
-
Actualités
26 févr. 2026
Microsoft 365 Local : Microsoft décline une version déconnectée du cloud public
Cette semaine, Microsoft dit mettre à jour ses offres « Sovereign Cloud ». Il faut plutôt comprendre que le géant de Redmond entend vendre en dehors de l’Europe des solutions de cloud privé en laissant la possibilité aux clients de piloter le control plane dans un mode « déconnecté ». Lire la suite
-
Actualités
23 févr. 2026
Pénurie de RAM et de stockage flash : OVHcloud augmente ses prix
Dans un contexte de flambée des coûts d’infrastructure, le fournisseur cloud français dit limiter la hausse du prix de ses services à moins de 11 % en moyenne. Elle affecte d’abord les produits utilisés par les clients des offres « low-cost », qui évoquent des augmentations de plus de 50 %. Lire la suite
-
Actualités
18 févr. 2026
Pour bâtir Mistral Compute, Mistral AI acquiert le spécialiste du serverless Koyeb
Fournisseur de LLM, ESN spécialisée dans l’IA et bientôt neocloud. Mistral AI signe un premier rachat sous le signe du multicloud et du serverless. Koyeb propulsera une bonne partie des fonctions de Mistral Compute, mais la société dirigée par Arthur Mensch doit encore préciser ses intentions. Lire la suite
-
Actualités
16 févr. 2026
LLM : la concurrence chinoise gagne du terrain
Si OpenAI, Anthropic et Google sont les fournisseurs les plus en vue pour les entreprises, les acteurs chinois ne se contentent pas de gagner des places sur les classements scientifiques. Ils visent les mêmes usages que leurs homologues américains. C’est le cas de Zai et de Moonshot AI. Lire la suite
-
Actualités
13 févr. 2026
Serveurs pour l’IA : Cisco présente sa solution modulaire
Durant Cisco Live Amsterdam, le constructeur a présenté au public les lames qui permettent à son châssis UCS X9508 de devenir un cluster de calcul particulièrement modulaire pour exécuter des IA génératives en entreprise. Lire la suite
-
Actualités
13 févr. 2026
GenAI : Anthropic lève 30 milliards de dollars et s’affirme comme le fournisseur des entreprises
Anthropic confirme une levée de fonds de 30 milliards de dollars. Le concurrent d’OpenAI se préparerait à une introduction en bourse, d’après le Financial Times. Les fonds serviront en partie à développer les produits B2B, à construire des centres de données, et à payer les factures cloud. Lire la suite
-
Actualités
11 févr. 2026
Mistral AI met un deuxième pied (et 1,2 milliard d’euros) dans l’infrastructure
Le spécialiste français de l’IA générative annonce un investissement en Suède. Pour Mistral, c'est un nouveau pas vers une indépendance de l’Europe dans l’IA. Lire la suite
par- Philippe Ducellier, Rédacteur en chef adjoint
- Gaétan Raoul, LeMagIT
-
Actualités
11 févr. 2026
Cisco Live : la puce G300 concrétise des réseaux ultrarapides pour l’IA
Capable de router les communications des serveurs de calcul à la vitesse de 102,4 Tbit/s, la dernière puce de Cisco va équiper aussi bien les switches des hyperscalers que ceux des entreprises privées, le constructeur militant désormais pour des IA souveraines. Lire la suite
-
Actualités
08 févr. 2026
Mémoires ZAM : le projet d’Intel pour remplacer la HBM des puces IA
Le fondeur américain pense pouvoir commercialiser d’ici à 2030 un nouveau type de circuits mémoires plus performants que ceux équipant les GPU de Nvidia et AMD. Les USA veulent y croire pour réduire leur dépendance aux fabricants coréens. Lire la suite
-
Opinion
02 févr. 2026
IA agentique : « Pour nous, le plus important est la notion de choix » (Martin Woodward, GitHub)
GitHub mesure déjà les effets de l’IA générative et agentique sur la génération de code, la production de pull requests et leur « merge ». Alors que l’IA accélère le développement et que les modèles évoluent aussi rapidement, Martin Woodward, vice-président des relations développeur chez GitHub, assure que la filiale de Microsoft ne cherche pas à imposer les outils agentiques à ses clients. Lire la suite
-
Actualités
02 févr. 2026
Automobile : les balbutiements de l’IA générative embarquée
Comme dans les autres secteurs, il y a fort à parier que l’IA générative soit d’abord déployée dans le cloud avant d’être installée, de manière ciblée en production, dans les voitures de monsieur et madame tout le monde. Du fait des contraintes techniques et économiques, les acteurs du secteur estiment qu’un mode hybride s’imposera de lui-même. Lire la suite
-
Actualités
29 janv. 2026
Model Vault : Cohere adapte ses modes de déploiement « privés » à l’IA agentique
Le fournisseur de LLM canadien a annoncé Model Vault, une plateforme SaaS dédiée sous la forme d’un cloud privé virtuel isolé pour l’inférence de modèles consacrés aux systèmes d’IA agentique et RAG. La solution est pensée comme un « compromis » entre les services SaaS et les déploiements self-managed en cloud ou sur site. Lire la suite
-
Actualités
27 janv. 2026
Puces IA : Microsoft Azure lance le Maia 200
Le nouvel accélérateur de Microsoft pour les services d’IA générative qu’il publie sur le cloud Azure est, sur le papier, plus puissant que les puces équivalentes chez AWS et GCP. Il dépasse même les performances du B200 de Nvidia en inférence. Lire la suite
-
Actualités
26 janv. 2026
4 tendances informatiques à surveiller en 2026 pour les utilisateurs finaux
L’IA, la sécurité axée sur l’identité, la fin du support de Windows 10 et le changement de nom de VMware en Omnissa sont en train de remodeler l’EUC, alors que les DSI prennent des décisions cruciales pour 2026 et au-delà. Lire la suite
-
Guide
20 janv. 2026
Dossier stockage : quelles solutions pour l’IA ?
Pour exécuter des projets d’IA dans un datacenter, il ne suffit pas de doter les serveurs de GPU. Il faut aussi leur communiquer les bonnes données, dans le bon format, à la bonne vitesse. Ce dossier fait le point sur les approches des fournisseurs de stockage. Lire la suite
-
Actualités
19 janv. 2026
Sovereign Core : IBM propose un kit pour monter son cloud souverain
IBM concocte une offre logicielle qui doit permettre à ses clients de bâtir ou de faire bâtir des clouds « souverains ». Un autre nom pour des clouds privés propulsés par ses logiciels ouverts et propriétaires. Lire la suite
-
Actualités
15 janv. 2026
Puces IA : les GPU de Nvidia encore autorisés puis interdits en Chine
Alors que Nvidia s’apprêtait à pouvoir honorer une commande chinoise de 2 millions de GPU H200, Pékin vient d’interdire à nouveau leur importation. Entre stocks baladeurs de GPU puissants et politiques d’export incertaines, l’Europe prie pour être fournie. Lire la suite
-
Conseil
13 janv. 2026
Les raisons d’utiliser l’IA sur site
La croissance rapide de l’intelligence artificielle est due en grande partie aux outils basés sur le cloud. Mais il existe de très bonnes raisons d’héberger les charges de travail d’une IA sur site. Lire la suite
-
Actualités
09 janv. 2026
Dragon LLM, ce Français qui mise sur des SLM financiers frugaux
Longtemps spécialisée dans la traduction automatique de documents financiers, la société française Dragon LLM entend désormais entraîner des modèles de langage adaptés à des tâches spécifiques capables de s’exécuter en local ou sur des serveurs sans GPU. Quitte à développer sa propre architecture de SLM, basée sur l’approche hybride Mamba-Transformer. Lire la suite
-
Actualités
09 janv. 2026
Pénurie des puces mémoire : Samsung et SK Hynix triplent leurs bénéfices
La demande des hyperscalers est si forte pour des composants HBM, DRAM et NAND que les fabricants de matériels informatiques surenchérissent pour en acheter des stocks. Résultat : les fabricants de ces composants s’enrichissent. Lire la suite
-
Actualités
07 janv. 2026
Puces IA : Nvidia détaille sa prochaine génération Rubin au CES
Entre le GPU Rubin, le processeur Vera et les nouveaux contrôleurs réseau, ce ne sont pas moins de six nouvelles puces que Nvidia lancera sur le marché des centres de calcul d’ici à la rentrée prochaine. Lire la suite
-
Actualités
06 janv. 2026
Pénurie de composants : les achats des hyperscalers explosent
Selon les dernières études de Synergy Research et Omdia, les achats d’équipements informatiques par les hyperscalers vont continuer de croître au moins jusqu’en 2029, voire 2030, pénalisant d’autant l’offre disponible pour les installations privées. Lire la suite
-
Actualités
05 janv. 2026
Empreinte environnementale de l’IA : aller au-delà des estimations
Comment mesurer l’empreinte environnementale de l’IA ; que mesurer ? Si la question peut paraître triviale, elle demeure sujette à débat. Les experts du domaine réclament aux acteurs de l’écosystème (des fournisseurs de LLM aux équipementiers en passant par les hébergeurs cloud) des mesures réelles, afin de mieux évaluer les impacts globaux et locaux. Lire la suite
-
Actualités
23 déc. 2025
Mémoires : Micron sabre le champagne sur fond de pénurie annoncée
Le fabricant de composants mémoires DRAM, HBM et NAND affiche des résultats record grâce aux commandes colossales que lui passent les hyperscalers pour suréquiper leurs services d’IA. Lire la suite
-
Actualités
22 déc. 2025
LLM : Google cherche la clé qui ouvre la porte de l’entraînement en continu
Chez Google Research, une petite équipe de quatre personnes jettent les bases théoriques et pratiques de ce que pourrait être l’héritière de la fameuse architecture Transformer. Elle concentre ses travaux sur les très longues fenêtres de contexte (plus de 2 millions de tokens) et l’apprentissage véritablement en continu. Lire la suite
-
Guide
16 déc. 2025
Dossier AWS re:Invent 2025 : ce qu’il faut en retenir
Ce dossier regroupe les principales annonces en matière d’IaaS, d’IA et de données qu’AWS a faites lors de la dernière édition de son événement annuel. Des entreprises françaises y témoignent des raisons qui les ont incitées à choisir l’hyperscaler. Lire la suite
-
Actualités
12 déc. 2025
IA sur site : l’offre de Dell séduit sur fond d’explosion des prix
Depuis l’année dernière, Dell propose une stack pour déployer l’IA derrière les murs d’une organisation. Elle a convaincu 200 clients en France. Mais avec les grands chantiers des hyperscalers qui provoquent une tension sur les composants, ses prix vont augmenter. Fortement. Lire la suite
-
Actualités
08 déc. 2025
DBaaS : AWS met l’accent sur la maîtrise des coûts
Pour conserver les clients qui exploitent ses services de bases de données, lors de salon re:Invent 2025, le géant du cloud a multiplié les optimisations et les offres commerciales. Lire la suite
-
Actualités
04 déc. 2025
Amazon Nova 2 : quatre LLM multimodaux pour rattraper Google Cloud
Lors de re:Invent 2025 à Las Vegas, AWS a présenté Amazon Nova 2, la deuxième itération de sa collection de grands modèles de langage, la troisième en deux ans. S’il ne cherche plus à casser les prix, le fournisseur tient à convaincre ses clients d’adopter des modèles légèrement en deçà de leurs concurrents, notamment Gemini 3 Pro, mais personnalisables. Lire la suite
-
Actualités
03 déc. 2025
Re:Invent 2025 : AWS dévoile ses nouvelles infrastructures pour l’IA
L’hyperscaler dote son cloud IaaS EC2 de nouvelles configurations basées sur son GPU Trainium3 et d’autres sur les derniers GPU de Nvidia. Deux technologies d’abord concurrentes, mais qui semblent vouées à se combiner. Lire la suite
-
Actualités
03 déc. 2025
Mistral 3 : Mistral AI veut faire jeu égal avec ses compétiteurs chinois
Le fournisseur de LLM lance Mistral 3, une collection de modèles open weight répartis en deux volets : un grand modèle prévu pour s’exécuter dans le cloud et trois petits LLM parés pour l’inférence locale. Mistral AI ne bat pas ses concurrents, mais garde son rang auprès de Qwen d’Alibaba, DeepSeek, Kimi et Google Gemma. Lire la suite
-
Guide
01 déc. 2025
Dossier réseau : quelle infrastructure pour l’IA ?
S’équiper de serveurs ultra-performants ne suffira pas à exécuter les projets d’IA. Il faut aussi qu’ils puissent communiquer très rapidement des données entre eux et vers les baies de disques. Ce dossier fait le point sur les offres de réseau pour l’IA. Lire la suite
-
Actualités
27 nov. 2025
Météo France : plus d'IA pour mieux prédire les événements extrêmes
Pour Météo France, l’IA promet d’optimiser les prévisions météorologiques. Toutefois, son adoption pose plusieurs défis en matière de compétences, d’accès aux ressources de calcul, de mix entre modèles physiques et d’IA. Lire la suite
-
Actualités
24 nov. 2025
DRAM, SSD : attention à la pénurie qui se prépare
Les hyperscalers et les fabricants de serveurs commandent trop de composants mémoire pour leurs infrastructures d’IA, plus que ce que le marché peut produire. Résultat : les prix explosent dès ce mois-ci et une pénurie pourrait s’installer jusqu’en 2027. Lire la suite
-
Projet IT
21 nov. 2025
Adoption de l’IA générative : BPCE fait un (gros) point d’étape
BPCE a largement mis à disposition des assistants IA aux mains de ses collaborateurs. Alors qu’il récolte les premiers fruits de son programme, le groupe prépare prudemment l’intégration de ses premiers agents IA. Lire la suite
-
Actualités
20 nov. 2025
Inférence IA à haute vitesse : OVHcloud choisit SambaNova
OVHcloud s’associe à SambaNova dans un partenariat non exclusif. Cette startup de la Silicon Valley développe des puces reprogrammables câblées pour l’inférence rapide des modèles de langage. Et ce, tout en étant moins énergivores que les GPU Nvidia. Lire la suite
-
Actualités
14 nov. 2025
IA sur Kubernetes : les analystes épinglent la CNCF face à l’hégémonie de Nvidia
La CNCF positionne Kubernetes comme une infrastructure standard pour l’IA, mais les analystes s’interrogent sur le niveau de participation d’un acteur majeur de l’IA à son nouveau programme de conformité : Nvidia. Lire la suite
par- Beth Pariseau, TechTarget
- Gaétan Raoul, LeMagIT
-
Actualités
14 nov. 2025
Processeurs : en pleine forme, AMD travaille ses ambitions
Selon ses derniers résultats, AMD vend plus de processeurs qu’Intel dans les serveurs, mais reste en deçà dans les PC. Sa PDG se fixe des objectifs pour ne pas se faire dépasser par les puces ARM et entend progresser sur les PC comme dans l’IA. Lire la suite
-
Guide
28 oct. 2025
NetApp Insight 2025 : tout ce qu’il faut en retenir
Ce dossier regroupe toutes les annonces et les informations relatives au fabricant de baies de stockage NetApp qui ont été discutées lors de sa dernière conférence annuelle : sa stratégie globale, son approche de l’IA, son écosystème et ses nouveaux produits. Lire la suite
-
Actualités
23 oct. 2025
Les grandes tendances technologiques de 2026 selon Gartner
Les analystes de Gartner dévoilent les principales tendances technologiques que les DSI doivent connaître pour 2026, notamment le développement de l’IA, la cybersécurité et le rapatriement des données. D’autres éléments de la liste sont plus prospectifs. Lire la suite
par- Jim O'Donnell, Journaliste ERP
- Gaétan Raoul, LeMagIT
-
Actualités
20 oct. 2025
NetApp et Intel présentent l’appliance d’IA d’appoint AIPod Mini
La petite machine se veut une solution immédiatement utilisable, rapide, sécurisée et économiquement avantageuse, pour exécuter sur site des IA qui tiennent compte des données privées des entreprises. Lire la suite
-
Actualités
17 oct. 2025
IA souveraine : T-Systems achète 10 000 GPU à NVIDIA pour un cloud européen
Les deux groupes ont annoncé la création d’une infrastructure européenne, hébergée en Allemagne, dédiée à l’intelligence artificielle. Sa mise en service est prévue pour 2026. Lire la suite
par- Yann Serra, LeMagIT
- Philippe Ducellier, Rédacteur en chef adjoint
-
Actualités
16 oct. 2025
Oracle adapte son réseau pour gérer des HPC de plus de 130 000 GPU
Avec Acceleron, Oracle veut interconnecter les salles et les bâtiments bardés de rack GPU dans ses data centers, tout en économisant de l’espace et l’énergie consommée par le réseau, pour ajouter davantage de puces IA. Lire la suite
-
Actualités
16 oct. 2025
Intel relance ses GPU, mais juste pour l’inférence
Intel présente un design de cluster de calcul pour l’IA similaire aux DGX NVL72 de Nvidia, qui ne permet pas d’entraîner des AI, mais consomme moins d’énergie pour les utiliser. Il est basé sur sa puce Gaudi3. Lire la suite
-
Guide
10 oct. 2025
IA : le guide des équipements serveur pour votre datacenter
Plateformes prêtes à l’emploi, clusters de serveurs, GPU… Ce guide présente les solutions d’infrastructure du moment pour exécuter les calculs de vos intelligences artificielles. Mais attention : un risque de pénurie les guette. Lire la suite
-
Actualités
07 oct. 2025
Datacenters IA : OpenAI va acheter pour 6 GW de GPU à AMD
L’éditeur de ChatGPT s’était précédemment engagé à acheter l’équivalent de 10 GW de puissance électrique en GPU au concurrent Nvidia. La dépense totale en puces d’IA est estimée à 500 milliards de dollars. Une somme qu’OpenAI n’a pas. Lire la suite
-
Actualités
06 oct. 2025
Granite 4.0 : IBM veut écraser la concurrence sur le terrain de l’inférence
Le géant de l’IT hybride les techniques, pour obtenir des SLM et des LLM plutôt performants et peu gourmands. Il oriente également leur entraînement vers l’IA agentique, quitte à perdre en transparence. Lire la suite
-
Actualités
02 oct. 2025
Taiwan refuse de partager la production de puces d’IA avec les USA
Alors que le gouvernement des USA se targue de négocier avec Taiwan le transfert sur son sol de la moitié de la production des puces de TSMC, la vice-première ministre taiwanaise rétorque qu’elle n’était pas au courant et qu’elle s’oppose même à une telle idée. Lire la suite
-
Actualités
23 sept. 2025
Nvidia : l’étrange investissement de 100 milliards à la faveur d’OpenAI
Cet investissement doit permettre à OpenAI de déployer des millions de GPU nécessaires au fonctionnement de son IA GPT. Ce déploiement se fera dans des datacenters avec lesquels Nvidia passe aussi des accords, au bénéfice de son action en bourse. Lire la suite
-
Actualités
22 sept. 2025
LLM-as-a-Service : Scaleway propose ses services d’inférence depuis Hugging Face
Jusqu’alors, Hugging Face avait connecté sa plateforme avec les services d’inférence de néocloud. Scaleway est le premier fournisseur français à se connecter à la bibliothèque de modèles d’IA open weight. Lire la suite
-
Actualités
22 sept. 2025
Infrastructure IA : Nvidia rachète Enfabrica
Le contrôleur CXL de la startup doit permettre à plusieurs GPU de partager une extension mémoire externe, accélérant l’entraînement des IA et rendant plus élastique l’inférence. Étonnamment, cette extension serait reliée par Ethernet. Lire la suite
-
Actualités
18 sept. 2025
Puces IA : la Chine ne veut plus de Nvidia
Dans la guerre économique qui l’oppose aux USA, la Chine a décidé de ne plus dépendre des GPU américains, d’autant que son champion Huawei a désormais des solutions pour développer ses IA. Nvidia accuse le coup. Lire la suite
-
Actualités
17 sept. 2025
Chez HPE, les ventes de serveurs progressent aussi
Comme Dell, HPE se félicite du succès de ses nouvelles machines configurées pour l’IA dans les datacenters. Une dynamique que tardent à suivre les solutions de stockage. Comme partout ailleurs. Lire la suite
-
Actualités
15 sept. 2025
Puces IA : SK Hynix lance la production des mémoires HBM4
Ce nouveau type de mémoire contribuera aux deux tiers des gains de performances qu’afficheront les prochains GPU. Pour SK Hynix, il s’agit surtout d’une avancée considérable face à Samsung, l’actuel leader des composants mémoires. Lire la suite
- 12 sept. 2025
-
Actualités
10 sept. 2025
Puces IA : Nvidia dévoile le Rubin CPX pour l’inférence
Le constructeur a dévoilé les caractéristiques probables du GPU qu’il lancera d’ici à la fin de l’année 2026 pour accélérer l’inférence. Lire la suite
-
Actualités
08 sept. 2025
Le Sénat américain propose d’interdire la vente de GPU en Europe
Une proposition de loi suggère que le barème TPP, qui empêche les GPU classiques d’entrer en Chine, s’applique à l’ensemble du monde. L’Europe serait dès lors condamnée à utiliser les services des hyperscalers américains pour travailler avec l’IA. Lire la suite
-
Actualités
27 août 2025
Nvidia commercialise son GPU Blackwell pour PME
Le GPU RTX Pro 6000 Blackwell Server Edition permet au tout venant des entreprises de bénéficier dans leur salle informatique, sur des serveurs d’appoint, de la puissance en IA des grands datacenters. Lire la suite
par- Yann Serra, LeMagIT
- Shane Snider, Senior News Writer
-
Guide
25 août 2025
Dossier : comment les USA régulent le marché des puces pour l’IA
Ce dossier répertorie toutes les clés pour comprendre la stratégie étatsunienne en matière de semiconducteurs de pointe. Les USA veulent en réglementer le commerce et s’en servir pour conforter leur suprématie en intelligence artificielle. Lire la suite
-
Actualités
22 août 2025
Empreinte écologique de l'IA générative : Google tente d’éteindre le feu
Dans un billet technique, Google affirme que l’empreinte énergétique de son IA générative Gemini serait largement inférieure aux estimations publiques alarmistes. Google y détaille sa méthodologie de calcul et revendique des gains d’efficacité sur les douze derniers mois. Mais la transparence n’est pas encore là. Lire la suite
-
Actualités
14 août 2025
Cosmos : Nvidia parie sur l’application de l’IA dans le monde physique
Avec ses modèles de monde Cosmos, le spécialiste fabless des GPU et de l’IA entend favoriser le développement de systèmes robotiques capables de planifier et d’exécuter des tâches de manière autonome. Lire la suite
par- Esther Shittu, News Writer
- Gaétan Raoul, LeMagIT
-
Actualités
12 août 2025
AMD et Nvidia reverseront 15 % de leurs revenus engrangés en Chine à l’Administration américaine
Cette mesure sans précédent prise par l’Administration Trump pourrait entrer en conflit avec les dispositions de la Constitution américaine interdisant les taxes à l’exportation. Lire la suite
par- Shane Snider, Senior News Writer
- La Rédaction
-
Actualités
08 août 2025
Donald Trump veut imposer 100 % de droits de douane sur les semiconducteurs
Le secteur des puces électroniques est bouleversé par les projets de l’Administration américaine d’imposer des droits de douane sur les semiconducteurs importés aux États-Unis. Lire la suite
-
Actualités
01 août 2025
OpenAI lance un Stargate norvégien sur fond de divorce avec Microsoft
D’ici à fin 2026, OpenAI fera héberger son IA GPT sur les 100 000 GPUs d’un datacenter au nord du continent, bâti par Nscale et Aker pour tout à fait autre chose. Mais pour OpenAI, il y a l’enjeu de maintenir une présence en Europe en dehors des datacenters d’Azure. Lire la suite
-
Actualités
29 juil. 2025
IA : Huawei dévoile son cluster de calcul rival de Nvidia
Le CloudMatrix 384 occupe 16 fois plus d’espace au sol et consomme 5 fois plus d’électricité que le DGX B200 NVL72 de Nvidia. Mais il est 70 % plus performant, permet d’entraîner des modèles 3,6 fois plus complexes et se contente d’un refroidissement par air. Lire la suite
-
Actualités
29 juil. 2025
L’inférence distribuée, l’avenir de Red Hat AI
Red Hat, filiale d’IBM, croit qu’elle a un rôle à jouer dans le déploiement de systèmes hybrides d’IA. Outre la commercialisation de vLLM, l’éditeur mise sur le projet d’inférence IA distribuée, llm-d. Lire la suite
-
Actualités
23 juil. 2025
L’Administration Trump lance un nouveau plan pour l’IA
Il n’est plus question de Stargate. Le nouveau plan d’action américain pour l’IA tout juste dévoilé par l’administration Trump vise à déréguler les chantiers de datacenters aux USA et à réglementer l’IA selon ses objectifs pour le reste du monde. Lire la suite
-
Actualités
23 juil. 2025
Bilan environnemental des LLM : ce que révèle l’étude de Mistral AI
Le fournisseur de LLM français entend offrir davantage de transparence à ses clients en commençant par l’analyse du cycle de vie de son plus gros LLM, Mistral Large 2. L’exercice met en lumière les défauts des estimations des concurrents… et de celles de Mistral AI. Lire la suite
-
Actualités
23 juil. 2025
Infrastructures IA : OpenAI signe des contrats qui jettent le flou sur Stargate
L’éditeur de ChatGPT, au cœur du projet Stargate pour la suprématie des USA en intelligence artificielle, semble faire le tour des hébergeurs américains pour son propre compte et lance des chantiers de datacenters étiquetés Stargate au Moyen-Orient. Lire la suite
-
Actualités
21 juil. 2025
On-premise, edge, multicloud : Clarifai veut unifier l’inférence des modèles d’IA
L’expert de la computer vision s’appuie sur sa plateforme afin de proposer un centre de contrôle des modèles d’IA générative et des agents IA. Son atout majeur ? La possibilité de déployer des charges de travail sur site, dans plusieurs clouds et en local depuis une seule interface Lire la suite
-
Actualités
16 juil. 2025
Semiconducteurs : de retour en Chine, Nvidia affiche son double jeu
Le fabricant de GPU a de nouveau le droit de vendre ses accélérateurs H20 pour entraîner les IA chinoises. D’un côté, Jensen Huang dit œuvrer au succès américain face à Huawei. De l’autre, il fait tout pour que Tencent, Alibaba et ByteDance rivalisent avec les IA occidentales. Lire la suite
-
Actualités
11 juil. 2025
Infrastructure IA : l’onde de choc CoreWeave
Autrefois mineur de cryptomonnaies, le fournisseur CoreWeave a pris la vague de l’IA générative. Une vague qui fait désormais déferler ses services « GPU on demand » jusque sur les côtes européennes. Lire la suite
-
Actualités
10 juil. 2025
Groq déploie son cloud et ses serveurs d’inférence IA en Europe
Groq installe ses serveurs d’inférence IA et sa plateforme logicielle dans un data center appartenant à Equinix à Helsinki, en Finlande. Le fournisseur espère ainsi convaincre les entreprises européennes d’adopter ses services. Lire la suite
-
Actualités
09 juil. 2025
Photons + neurones : un duo franco-québécois à la conquête de l’IA quantique
La pépite française spécialiste du calcul photonique, Quandela s’allie à l’Institut québécois d’intelligence artificielle (Mila) pour développer des solutions qui combineront IA et informatique quantique. Un moyen également pour Quandela de continuer son implantation internationale au Canada. Lire la suite
-
Actualités
08 juil. 2025
IA : Phison utilise la capacité des SSD pour étendre la RAM des GPU
Avec ses logiciels aiDaptive+ et ses SSD PASCARI, Phison permet à de simples machines personnelles d’accéder à des fonctions de pointe jusqu’ici réservées aux datacenters, notamment le fine-tuning de grands modèles. Lire la suite
par- Stéphane Larcher, LeMagIT
- Yann Serra, LeMagIT
-
Actualités
02 juil. 2025
IA locale : Microsoft veut confier le paramétrage de Windows 11 à un SLM
Le petit modèle de langage Mu (à peine 330 millions de paramètres) a été entraîné pour effectuer de petites tâches en local, sur un NPU. Par exemple, pour régler les options de Windows 11. Lire la suite
-
Actualités
25 juin 2025
IA privée et « souveraine » : Teradata lance AI Factory
Pour les entreprises préoccupées par le contrôle des coûts du cloud et la souveraineté des données, la nouvelle plateforme du fournisseur de longue date promet aux utilisateurs de construire des outils d’IA avancés au sein de leurs propres systèmes. Lire la suite
par- Gaétan Raoul, LeMagIT
- Eric Avidon, TechTarget
-
Guide
20 juin 2025
Dossier infrastructure : l’essentiel de Dell Tech World 2025
Surfant sur la nécessité d’utiliser l’IA dans des datacenters privés, le constructeur a multiplié lors de sa dernière conférence mondiale les approches originales pour se passer des infrastructures des hyperscalers. Lire la suite
-
Actualités
17 juin 2025
IA : la CNCF entrevoit une alternative ouverte à CUDA de Nvidia
Les leaders de l’open source soulignent les avancées de projets tels que OpenTelemetry et discutent du rôle de la communauté open source, dans l’élaboration de l’avenir des charges de travail d’intelligence artificielle et dans la promotion de la collaboration mondiale dans un contexte de tensions géopolitiques. Lire la suite
par- Aaron Tan, Informa TechTarget
- Gaétan Raoul, LeMagIT
- 17 juin 2025
-
E-Zine
17 juin 2025
Storage 40 – Stockage accéléré : les dernières solutions pour épauler l’IA
Dans ce nouveau numéro, Storage explore les dernières solutions de stockage accéléré pour répondre aux exigences de l’IA. Le magazine met en lumière les innovations, les performances extrêmes et stratégies hybrides des acteurs majeurs comme Nvidia, Huawei, Pure Storage, Hammerspace ou Scality. Lire la suite
-
Actualités
16 juin 2025
Réseau pour grands calculs : UALink 1.0 se dévoile
Les hyperscalers et les entreprises veulent pouvoir router leurs traitements dans les clusters de GPU en passant par autre chose que le système NVLink propriétaire de Nvidia. UALink est la réponse d’un consortium de fournisseurs. Lire la suite
-
Actualités
16 juin 2025
IA agentique : Datadog jauge l’intérêt des clients
Lors de son événement DASH 2025, Datadog a sans surprise mis l’accent sur ses annonces dédiées à l’IA générative et agentique. Hormis ses assistants IA, beaucoup de fonctionnalités sont encore en préversion. De fait, ses clients sont tiraillés quant à leur stratégie IA, tandis que l’éditeur n’a pas fixé la tarification de ses agents IA. Lire la suite
-
Actualités
16 juin 2025
Le cloud OCI achète déjà 130 000 exemplaires du dernier GPU d’AMD
Oracle revendique que son cloud public sera le premier à proposer des services d’IA basés sur le MI355X. Ils seront deux fois moins chers que ceux motorisés par des GPU Nvidia. Lire la suite
-
Actualités
13 juin 2025
Puces pour l’IA : AMD dévoile son GPU MI350X
Le constructeur prétend lancer la meilleure alternative aux GPU Blackwell de Nvidia. Son GPU MI350X peut charger des LLM de plus grande taille qu’un B200, avec une précision de 6 bits inédite qui autorise de meilleurs compromis en inférence. Lire la suite
-
Actualités
12 juin 2025
Avec Mistral AI, Nvidia s’affiche en fer de lance de l’IA souveraine
En soutenant l’IA souveraine, Nvidia entend bien maintenir son quasi-monopole en Europe dans la fourniture d’infrastructures dédiées à l’IA, et plus largement à la simulation par ordinateur. Lire la suite
-
Actualités
10 juin 2025
« From Chip to Cloud » et vice-versa : la stratégie de Microsoft en matière d’IA locale
Pour Microsoft, l’IA générative et agentique est un coup de fouet à la vente d’ordinateurs en entreprise. Peu importe le form factor, le chipset qui le propulse, l’appareil confié aux collaborateurs doit être prêt pour l’IA. Car les modèles de langage et de machine learning ne sont pas voués à rester sur le cloud. Lire la suite
-
Actualités
10 juin 2025
Untether AI, Brium et Enosemi : les rachats d’AMD pour rattraper Nvidia
Si Enosemi ne doit servir qu’à perfectionner les réseaux d’entraînement de LLM en datacenters, les deux autres startups permettront à AMD de progresser significativement dans l’optimisation des IA pour les entreprises. Lire la suite
-
Actualités
06 juin 2025
Semiconducteurs : Les USA réduisent la voilure du CHIPS Act
L’administration Trump annonce revoir à la baisse les subventions déjà consenties dans le cadre de ce plan d’investissement de 52,7 milliards de dollars, voté sous Joe Biden pour relancer l’industrie des semiconducteurs sur le sol américain. Lire la suite
-
Actualités
03 juin 2025
Puces IA : EnCharge AI lance une alternative à Qualcomm
Dans la catégorie des accélérateurs pour PC, la puce EN100 de la startup américaine n’est pas intrinsèquement plus puissante que le Cloud AI 100 de Qualcomm, mais elle est beaucoup moins énergivore. Ce qui permet de pousser sa fréquence. Lire la suite
