Hardware IA (GPU, FPGA, etc.)
-
Opinion
02 févr. 2026
IA agentique : « Pour nous, le plus important est la notion de choix » (Martin Woodward, GitHub)
GitHub mesure déjà les effets de l’IA générative et agentique sur la génération de code, la production de pull requests et leur « merge ». Alors que l’IA accélère le développement et que les modèles évoluent aussi rapidement, Martin Woodward, vice-président des relations développeur chez GitHub, assure que la filiale de Microsoft ne cherche pas à imposer les outils agentiques à ses clients. Lire la suite
-
Actualités
02 févr. 2026
Automobile : les balbutiements de l’IA générative embarquée
Comme dans les autres secteurs, il y a fort à parier que l’IA générative soit d’abord déployée dans le cloud avant d’être installée, de manière ciblée en production, dans les voitures de monsieur et madame tout le monde. Du fait des contraintes techniques et économiques, les acteurs du secteur estiment qu’un mode hybride s’imposera de lui-même. Lire la suite
- Pharmacie Familia sécurise ses sauvegardes et gagne en sérénité opérationnelle ... –Etude de cas
- Cas d’usage : Migration infonuagique et modernisation des charges de travail –Livre Blanc
- Dépanner les environnements Kubernetes grâce à l’observabilité –eBook
-
Dans ce numéro:
- Comment calculer le ROI de la cybersécurité pour le PDG et le conseil d’administration
- Ready for IT : quel ROI pour la cybersécurité ?
- Mettre en œuvre une stratégie de sécurité basée sur les risques en 5 étapes
-
Actualités
29 janv. 2026
Model Vault : Cohere adapte ses modes de déploiement « privés » à l’IA agentique
Le fournisseur de LLM canadien a annoncé Model Vault, une plateforme SaaS dédiée sous la forme d’un cloud privé virtuel isolé pour l’inférence de modèles consacrés aux systèmes d’IA agentique et RAG. La solution est pensée comme un « compromis » entre les services SaaS et les déploiements self-managed en cloud ou sur site. Lire la suite
-
Actualités
27 janv. 2026
Puces IA : Microsoft Azure lance le Maia 200
Le nouvel accélérateur de Microsoft pour les services d’IA générative qu’il publie sur le cloud Azure est, sur le papier, plus puissant que les puces équivalentes chez AWS et GCP. Il dépasse même les performances du B200 de Nvidia en inférence. Lire la suite
-
Actualités
26 janv. 2026
4 tendances informatiques à surveiller en 2026 pour les utilisateurs finaux
L’IA, la sécurité axée sur l’identité, la fin du support de Windows 10 et le changement de nom de VMware en Omnissa sont en train de remodeler l’EUC, alors que les DSI prennent des décisions cruciales pour 2026 et au-delà. Lire la suite
-
Guide
20 janv. 2026
Dossier stockage : quelles solutions pour l’IA ?
Pour exécuter des projets d’IA dans un datacenter, il ne suffit pas de doter les serveurs de GPU. Il faut aussi leur communiquer les bonnes données, dans le bon format, à la bonne vitesse. Ce dossier fait le point sur les approches des fournisseurs de stockage. Lire la suite
-
Actualités
19 janv. 2026
Sovereign Core : IBM propose un kit pour monter son cloud souverain
IBM concocte une offre logicielle qui doit permettre à ses clients de bâtir ou de faire bâtir des clouds « souverains ». Un autre nom pour des clouds privés propulsés par ses logiciels ouverts et propriétaires. Lire la suite
-
Actualités
15 janv. 2026
Puces IA : les GPU de Nvidia encore autorisés puis interdits en Chine
Alors que Nvidia s’apprêtait à pouvoir honorer une commande chinoise de 2 millions de GPU H200, Pékin vient d’interdire à nouveau leur importation. Entre stocks baladeurs de GPU puissants et politiques d’export incertaines, l’Europe prie pour être fournie. Lire la suite
-
Conseil
13 janv. 2026
Les raisons d’utiliser l’IA sur site
La croissance rapide de l’intelligence artificielle est due en grande partie aux outils basés sur le cloud. Mais il existe de très bonnes raisons d’héberger les charges de travail d’une IA sur site. Lire la suite
-
Actualités
09 janv. 2026
Dragon LLM, ce Français qui mise sur des SLM financiers frugaux
Longtemps spécialisée dans la traduction automatique de documents financiers, la société française Dragon LLM entend désormais entraîner des modèles de langage adaptés à des tâches spécifiques capables de s’exécuter en local ou sur des serveurs sans GPU. Quitte à développer sa propre architecture de SLM, basée sur l’approche hybride Mamba-Transformer. Lire la suite
-
Actualités
09 janv. 2026
Pénurie des puces mémoire : Samsung et SK Hynix triplent leurs bénéfices
La demande des hyperscalers est si forte pour des composants HBM, DRAM et NAND que les fabricants de matériels informatiques surenchérissent pour en acheter des stocks. Résultat : les fabricants de ces composants s’enrichissent. Lire la suite
-
Actualités
07 janv. 2026
Puces IA : Nvidia détaille sa prochaine génération Rubin au CES
Entre le GPU Rubin, le processeur Vera et les nouveaux contrôleurs réseau, ce ne sont pas moins de six nouvelles puces que Nvidia lancera sur le marché des centres de calcul d’ici à la rentrée prochaine. Lire la suite
-
Actualités
06 janv. 2026
Pénurie de composants : les achats des hyperscalers explosent
Selon les dernières études de Synergy Research et Omdia, les achats d’équipements informatiques par les hyperscalers vont continuer de croître au moins jusqu’en 2029, voire 2030, pénalisant d’autant l’offre disponible pour les installations privées. Lire la suite
-
Actualités
05 janv. 2026
Empreinte environnementale de l’IA : aller au-delà des estimations
Comment mesurer l’empreinte environnementale de l’IA ; que mesurer ? Si la question peut paraître triviale, elle demeure sujette à débat. Les experts du domaine réclament aux acteurs de l’écosystème (des fournisseurs de LLM aux équipementiers en passant par les hébergeurs cloud) des mesures réelles, afin de mieux évaluer les impacts globaux et locaux. Lire la suite
-
Actualités
23 déc. 2025
Mémoires : Micron sabre le champagne sur fond de pénurie annoncée
Le fabricant de composants mémoires DRAM, HBM et NAND affiche des résultats record grâce aux commandes colossales que lui passent les hyperscalers pour suréquiper leurs services d’IA. Lire la suite
-
Actualités
22 déc. 2025
LLM : Google cherche la clé qui ouvre la porte de l’entraînement en continu
Chez Google Research, une petite équipe de quatre personnes jettent les bases théoriques et pratiques de ce que pourrait être l’héritière de la fameuse architecture Transformer. Elle concentre ses travaux sur les très longues fenêtres de contexte (plus de 2 millions de tokens) et l’apprentissage véritablement en continu. Lire la suite
-
Guide
16 déc. 2025
Dossier AWS re:Invent 2025 : ce qu’il faut en retenir
Ce dossier regroupe les principales annonces en matière d’IaaS, d’IA et de données qu’AWS a faites lors de la dernière édition de son événement annuel. Des entreprises françaises y témoignent des raisons qui les ont incitées à choisir l’hyperscaler. Lire la suite
-
Actualités
12 déc. 2025
IA sur site : l’offre de Dell séduit sur fond d’explosion des prix
Depuis l’année dernière, Dell propose une stack pour déployer l’IA derrière les murs d’une organisation. Elle a convaincu 200 clients en France. Mais avec les grands chantiers des hyperscalers qui provoquent une tension sur les composants, ses prix vont augmenter. Fortement. Lire la suite
-
Actualités
08 déc. 2025
DBaaS : AWS met l’accent sur la maîtrise des coûts
Pour conserver les clients qui exploitent ses services de bases de données, lors de salon re:Invent 2025, le géant du cloud a multiplié les optimisations et les offres commerciales. Lire la suite
-
Actualités
04 déc. 2025
Amazon Nova 2 : quatre LLM multimodaux pour rattraper Google Cloud
Lors de re:Invent 2025 à Las Vegas, AWS a présenté Amazon Nova 2, la deuxième itération de sa collection de grands modèles de langage, la troisième en deux ans. S’il ne cherche plus à casser les prix, le fournisseur tient à convaincre ses clients d’adopter des modèles légèrement en deçà de leurs concurrents, notamment Gemini 3 Pro, mais personnalisables. Lire la suite
-
Actualités
03 déc. 2025
Re:Invent 2025 : AWS dévoile ses nouvelles infrastructures pour l’IA
L’hyperscaler dote son cloud IaaS EC2 de nouvelles configurations basées sur son GPU Trainium3 et d’autres sur les derniers GPU de Nvidia. Deux technologies d’abord concurrentes, mais qui semblent vouées à se combiner. Lire la suite
-
Actualités
03 déc. 2025
Mistral 3 : Mistral AI veut faire jeu égal avec ses compétiteurs chinois
Le fournisseur de LLM lance Mistral 3, une collection de modèles open weight répartis en deux volets : un grand modèle prévu pour s’exécuter dans le cloud et trois petits LLM parés pour l’inférence locale. Mistral AI ne bat pas ses concurrents, mais garde son rang auprès de Qwen d’Alibaba, DeepSeek, Kimi et Google Gemma. Lire la suite
-
Guide
01 déc. 2025
Dossier réseau : quelle infrastructure pour l’IA ?
S’équiper de serveurs ultra-performants ne suffira pas à exécuter les projets d’IA. Il faut aussi qu’ils puissent communiquer très rapidement des données entre eux et vers les baies de disques. Ce dossier fait le point sur les offres de réseau pour l’IA. Lire la suite
-
Actualités
27 nov. 2025
Météo France : plus d'IA pour mieux prédire les événements extrêmes
Pour Météo France, l’IA promet d’optimiser les prévisions météorologiques. Toutefois, son adoption pose plusieurs défis en matière de compétences, d’accès aux ressources de calcul, de mix entre modèles physiques et d’IA. Lire la suite
-
Actualités
24 nov. 2025
DRAM, SSD : attention à la pénurie qui se prépare
Les hyperscalers et les fabricants de serveurs commandent trop de composants mémoire pour leurs infrastructures d’IA, plus que ce que le marché peut produire. Résultat : les prix explosent dès ce mois-ci et une pénurie pourrait s’installer jusqu’en 2027. Lire la suite
-
Projet IT
21 nov. 2025
Adoption de l’IA générative : BPCE fait un (gros) point d’étape
BPCE a largement mis à disposition des assistants IA aux mains de ses collaborateurs. Alors qu’il récolte les premiers fruits de son programme, le groupe prépare prudemment l’intégration de ses premiers agents IA. Lire la suite
-
Actualités
20 nov. 2025
Inférence IA à haute vitesse : OVHcloud choisit SambaNova
OVHcloud s’associe à SambaNova dans un partenariat non exclusif. Cette startup de la Silicon Valley développe des puces reprogrammables câblées pour l’inférence rapide des modèles de langage. Et ce, tout en étant moins énergivores que les GPU Nvidia. Lire la suite
-
Actualités
14 nov. 2025
IA sur Kubernetes : les analystes épinglent la CNCF face à l’hégémonie de Nvidia
La CNCF positionne Kubernetes comme une infrastructure standard pour l’IA, mais les analystes s’interrogent sur le niveau de participation d’un acteur majeur de l’IA à son nouveau programme de conformité : Nvidia. Lire la suite
par- Beth Pariseau, TechTarget
- Gaétan Raoul, LeMagIT
-
Actualités
14 nov. 2025
Processeurs : en pleine forme, AMD travaille ses ambitions
Selon ses derniers résultats, AMD vend plus de processeurs qu’Intel dans les serveurs, mais reste en deçà dans les PC. Sa PDG se fixe des objectifs pour ne pas se faire dépasser par les puces ARM et entend progresser sur les PC comme dans l’IA. Lire la suite
-
Guide
28 oct. 2025
NetApp Insight 2025 : tout ce qu’il faut en retenir
Ce dossier regroupe toutes les annonces et les informations relatives au fabricant de baies de stockage NetApp qui ont été discutées lors de sa dernière conférence annuelle : sa stratégie globale, son approche de l’IA, son écosystème et ses nouveaux produits. Lire la suite
-
Actualités
23 oct. 2025
Les grandes tendances technologiques de 2026 selon Gartner
Les analystes de Gartner dévoilent les principales tendances technologiques que les DSI doivent connaître pour 2026, notamment le développement de l’IA, la cybersécurité et le rapatriement des données. D’autres éléments de la liste sont plus prospectifs. Lire la suite
par- Jim O'Donnell, Journaliste ERP
- Gaétan Raoul, LeMagIT
-
Actualités
20 oct. 2025
NetApp et Intel présentent l’appliance d’IA d’appoint AIPod Mini
La petite machine se veut une solution immédiatement utilisable, rapide, sécurisée et économiquement avantageuse, pour exécuter sur site des IA qui tiennent compte des données privées des entreprises. Lire la suite
-
Actualités
17 oct. 2025
IA souveraine : T-Systems achète 10 000 GPU à NVIDIA pour un cloud européen
Les deux groupes ont annoncé la création d’une infrastructure européenne, hébergée en Allemagne, dédiée à l’intelligence artificielle. Sa mise en service est prévue pour 2026. Lire la suite
par- Yann Serra, LeMagIT
- Philippe Ducellier, Rédacteur en chef adjoint
-
Actualités
16 oct. 2025
Oracle adapte son réseau pour gérer des HPC de plus de 130 000 GPU
Avec Acceleron, Oracle veut interconnecter les salles et les bâtiments bardés de rack GPU dans ses data centers, tout en économisant de l’espace et l’énergie consommée par le réseau, pour ajouter davantage de puces IA. Lire la suite
-
Actualités
16 oct. 2025
Intel relance ses GPU, mais juste pour l’inférence
Intel présente un design de cluster de calcul pour l’IA similaire aux DGX NVL72 de Nvidia, qui ne permet pas d’entraîner des AI, mais consomme moins d’énergie pour les utiliser. Il est basé sur sa puce Gaudi3. Lire la suite
-
Guide
10 oct. 2025
IA : le guide des équipements serveur pour votre datacenter
Plateformes prêtes à l’emploi, clusters de serveurs, GPU… Ce guide présente les solutions d’infrastructure du moment pour exécuter les calculs de vos intelligences artificielles. Mais attention : un risque de pénurie les guette. Lire la suite
-
Actualités
07 oct. 2025
Datacenters IA : OpenAI va acheter pour 6 GW de GPU à AMD
L’éditeur de ChatGPT s’était précédemment engagé à acheter l’équivalent de 10 GW de puissance électrique en GPU au concurrent Nvidia. La dépense totale en puces d’IA est estimée à 500 milliards de dollars. Une somme qu’OpenAI n’a pas. Lire la suite
-
Actualités
06 oct. 2025
Granite 4.0 : IBM veut écraser la concurrence sur le terrain de l’inférence
Le géant de l’IT hybride les techniques, pour obtenir des SLM et des LLM plutôt performants et peu gourmands. Il oriente également leur entraînement vers l’IA agentique, quitte à perdre en transparence. Lire la suite
-
Actualités
02 oct. 2025
Taiwan refuse de partager la production de puces d’IA avec les USA
Alors que le gouvernement des USA se targue de négocier avec Taiwan le transfert sur son sol de la moitié de la production des puces de TSMC, la vice-première ministre taiwanaise rétorque qu’elle n’était pas au courant et qu’elle s’oppose même à une telle idée. Lire la suite
-
Actualités
23 sept. 2025
Nvidia : l’étrange investissement de 100 milliards à la faveur d’OpenAI
Cet investissement doit permettre à OpenAI de déployer des millions de GPU nécessaires au fonctionnement de son IA GPT. Ce déploiement se fera dans des datacenters avec lesquels Nvidia passe aussi des accords, au bénéfice de son action en bourse. Lire la suite
-
Actualités
22 sept. 2025
LLM-as-a-Service : Scaleway propose ses services d’inférence depuis Hugging Face
Jusqu’alors, Hugging Face avait connecté sa plateforme avec les services d’inférence de néocloud. Scaleway est le premier fournisseur français à se connecter à la bibliothèque de modèles d’IA open weight. Lire la suite
-
Actualités
22 sept. 2025
Infrastructure IA : Nvidia rachète Enfabrica
Le contrôleur CXL de la startup doit permettre à plusieurs GPU de partager une extension mémoire externe, accélérant l’entraînement des IA et rendant plus élastique l’inférence. Étonnamment, cette extension serait reliée par Ethernet. Lire la suite
-
Actualités
18 sept. 2025
Puces IA : la Chine ne veut plus de Nvidia
Dans la guerre économique qui l’oppose aux USA, la Chine a décidé de ne plus dépendre des GPU américains, d’autant que son champion Huawei a désormais des solutions pour développer ses IA. Nvidia accuse le coup. Lire la suite
-
Actualités
17 sept. 2025
Chez HPE, les ventes de serveurs progressent aussi
Comme Dell, HPE se félicite du succès de ses nouvelles machines configurées pour l’IA dans les datacenters. Une dynamique que tardent à suivre les solutions de stockage. Comme partout ailleurs. Lire la suite
-
Actualités
15 sept. 2025
Puces IA : SK Hynix lance la production des mémoires HBM4
Ce nouveau type de mémoire contribuera aux deux tiers des gains de performances qu’afficheront les prochains GPU. Pour SK Hynix, il s’agit surtout d’une avancée considérable face à Samsung, l’actuel leader des composants mémoires. Lire la suite
- 12 sept. 2025
-
Actualités
10 sept. 2025
Puces IA : Nvidia dévoile le Rubin CPX pour l’inférence
Le constructeur a dévoilé les caractéristiques probables du GPU qu’il lancera d’ici à la fin de l’année 2026 pour accélérer l’inférence. Lire la suite
-
Actualités
08 sept. 2025
Le Sénat américain propose d’interdire la vente de GPU en Europe
Une proposition de loi suggère que le barème TPP, qui empêche les GPU classiques d’entrer en Chine, s’applique à l’ensemble du monde. L’Europe serait dès lors condamnée à utiliser les services des hyperscalers américains pour travailler avec l’IA. Lire la suite
-
Actualités
27 août 2025
Nvidia commercialise son GPU Blackwell pour PME
Le GPU RTX Pro 6000 Blackwell Server Edition permet au tout venant des entreprises de bénéficier dans leur salle informatique, sur des serveurs d’appoint, de la puissance en IA des grands datacenters. Lire la suite
par- Yann Serra, LeMagIT
- Shane Snider, Senior News Writer
-
Guide
25 août 2025
Dossier : comment les USA régulent le marché des puces pour l’IA
Ce dossier répertorie toutes les clés pour comprendre la stratégie étatsunienne en matière de semiconducteurs de pointe. Les USA veulent en réglementer le commerce et s’en servir pour conforter leur suprématie en intelligence artificielle. Lire la suite
-
Actualités
22 août 2025
Empreinte écologique de l'IA générative : Google tente d’éteindre le feu
Dans un billet technique, Google affirme que l’empreinte énergétique de son IA générative Gemini serait largement inférieure aux estimations publiques alarmistes. Google y détaille sa méthodologie de calcul et revendique des gains d’efficacité sur les douze derniers mois. Mais la transparence n’est pas encore là. Lire la suite
-
Actualités
14 août 2025
Cosmos : Nvidia parie sur l’application de l’IA dans le monde physique
Avec ses modèles de monde Cosmos, le spécialiste fabless des GPU et de l’IA entend favoriser le développement de systèmes robotiques capables de planifier et d’exécuter des tâches de manière autonome. Lire la suite
par- Esther Shittu, News Writer
- Gaétan Raoul, LeMagIT
-
Actualités
12 août 2025
AMD et Nvidia reverseront 15 % de leurs revenus engrangés en Chine à l’Administration américaine
Cette mesure sans précédent prise par l’Administration Trump pourrait entrer en conflit avec les dispositions de la Constitution américaine interdisant les taxes à l’exportation. Lire la suite
par- Shane Snider, Senior News Writer
- La Rédaction
-
Actualités
08 août 2025
Donald Trump veut imposer 100 % de droits de douane sur les semiconducteurs
Le secteur des puces électroniques est bouleversé par les projets de l’Administration américaine d’imposer des droits de douane sur les semiconducteurs importés aux États-Unis. Lire la suite
-
Actualités
01 août 2025
OpenAI lance un Stargate norvégien sur fond de divorce avec Microsoft
D’ici à fin 2026, OpenAI fera héberger son IA GPT sur les 100 000 GPUs d’un datacenter au nord du continent, bâti par Nscale et Aker pour tout à fait autre chose. Mais pour OpenAI, il y a l’enjeu de maintenir une présence en Europe en dehors des datacenters d’Azure. Lire la suite
-
Actualités
29 juil. 2025
IA : Huawei dévoile son cluster de calcul rival de Nvidia
Le CloudMatrix 384 occupe 16 fois plus d’espace au sol et consomme 5 fois plus d’électricité que le DGX B200 NVL72 de Nvidia. Mais il est 70 % plus performant, permet d’entraîner des modèles 3,6 fois plus complexes et se contente d’un refroidissement par air. Lire la suite
-
Actualités
29 juil. 2025
L’inférence distribuée, l’avenir de Red Hat AI
Red Hat, filiale d’IBM, croit qu’elle a un rôle à jouer dans le déploiement de systèmes hybrides d’IA. Outre la commercialisation de vLLM, l’éditeur mise sur le projet d’inférence IA distribuée, llm-d. Lire la suite
-
Actualités
23 juil. 2025
L’Administration Trump lance un nouveau plan pour l’IA
Il n’est plus question de Stargate. Le nouveau plan d’action américain pour l’IA tout juste dévoilé par l’administration Trump vise à déréguler les chantiers de datacenters aux USA et à réglementer l’IA selon ses objectifs pour le reste du monde. Lire la suite
-
Actualités
23 juil. 2025
Bilan environnemental des LLM : ce que révèle l’étude de Mistral AI
Le fournisseur de LLM français entend offrir davantage de transparence à ses clients en commençant par l’analyse du cycle de vie de son plus gros LLM, Mistral Large 2. L’exercice met en lumière les défauts des estimations des concurrents… et de celles de Mistral AI. Lire la suite
-
Actualités
23 juil. 2025
Infrastructures IA : OpenAI signe des contrats qui jettent le flou sur Stargate
L’éditeur de ChatGPT, au cœur du projet Stargate pour la suprématie des USA en intelligence artificielle, semble faire le tour des hébergeurs américains pour son propre compte et lance des chantiers de datacenters étiquetés Stargate au Moyen-Orient. Lire la suite
-
Actualités
21 juil. 2025
On-premise, edge, multicloud : Clarifai veut unifier l’inférence des modèles d’IA
L’expert de la computer vision s’appuie sur sa plateforme afin de proposer un centre de contrôle des modèles d’IA générative et des agents IA. Son atout majeur ? La possibilité de déployer des charges de travail sur site, dans plusieurs clouds et en local depuis une seule interface Lire la suite
-
Actualités
16 juil. 2025
Semiconducteurs : de retour en Chine, Nvidia affiche son double jeu
Le fabricant de GPU a de nouveau le droit de vendre ses accélérateurs H20 pour entraîner les IA chinoises. D’un côté, Jensen Huang dit œuvrer au succès américain face à Huawei. De l’autre, il fait tout pour que Tencent, Alibaba et ByteDance rivalisent avec les IA occidentales. Lire la suite
-
Actualités
11 juil. 2025
Infrastructure IA : l’onde de choc CoreWeave
Autrefois mineur de cryptomonnaies, le fournisseur CoreWeave a pris la vague de l’IA générative. Une vague qui fait désormais déferler ses services « GPU on demand » jusque sur les côtes européennes. Lire la suite
-
Actualités
10 juil. 2025
Groq déploie son cloud et ses serveurs d’inférence IA en Europe
Groq installe ses serveurs d’inférence IA et sa plateforme logicielle dans un data center appartenant à Equinix à Helsinki, en Finlande. Le fournisseur espère ainsi convaincre les entreprises européennes d’adopter ses services. Lire la suite
-
Actualités
09 juil. 2025
Photons + neurones : un duo franco-québécois à la conquête de l’IA quantique
La pépite française spécialiste du calcul photonique, Quandela s’allie à l’Institut québécois d’intelligence artificielle (Mila) pour développer des solutions qui combineront IA et informatique quantique. Un moyen également pour Quandela de continuer son implantation internationale au Canada. Lire la suite
-
Actualités
08 juil. 2025
IA : Phison utilise la capacité des SSD pour étendre la RAM des GPU
Avec ses logiciels aiDaptive+ et ses SSD PASCARI, Phison permet à de simples machines personnelles d’accéder à des fonctions de pointe jusqu’ici réservées aux datacenters, notamment le fine-tuning de grands modèles. Lire la suite
par- Stéphane Larcher, LeMagIT
- Yann Serra, LeMagIT
-
Actualités
02 juil. 2025
IA locale : Microsoft veut confier le paramétrage de Windows 11 à un SLM
Le petit modèle de langage Mu (à peine 330 millions de paramètres) a été entraîné pour effectuer de petites tâches en local, sur un NPU. Par exemple, pour régler les options de Windows 11. Lire la suite
-
Actualités
25 juin 2025
IA privée et « souveraine » : Teradata lance AI Factory
Pour les entreprises préoccupées par le contrôle des coûts du cloud et la souveraineté des données, la nouvelle plateforme du fournisseur de longue date promet aux utilisateurs de construire des outils d’IA avancés au sein de leurs propres systèmes. Lire la suite
par- Gaétan Raoul, LeMagIT
- Eric Avidon, TechTarget
-
Guide
20 juin 2025
Dossier infrastructure : l’essentiel de Dell Tech World 2025
Surfant sur la nécessité d’utiliser l’IA dans des datacenters privés, le constructeur a multiplié lors de sa dernière conférence mondiale les approches originales pour se passer des infrastructures des hyperscalers. Lire la suite
-
Actualités
17 juin 2025
IA : la CNCF entrevoit une alternative ouverte à CUDA de Nvidia
Les leaders de l’open source soulignent les avancées de projets tels que OpenTelemetry et discutent du rôle de la communauté open source, dans l’élaboration de l’avenir des charges de travail d’intelligence artificielle et dans la promotion de la collaboration mondiale dans un contexte de tensions géopolitiques. Lire la suite
par- Aaron Tan, Informa TechTarget
- Gaétan Raoul, LeMagIT
- 17 juin 2025
-
E-Zine
17 juin 2025
Storage 40 – Stockage accéléré : les dernières solutions pour épauler l’IA
Dans ce nouveau numéro, Storage explore les dernières solutions de stockage accéléré pour répondre aux exigences de l’IA. Le magazine met en lumière les innovations, les performances extrêmes et stratégies hybrides des acteurs majeurs comme Nvidia, Huawei, Pure Storage, Hammerspace ou Scality. Lire la suite
-
Actualités
16 juin 2025
Réseau pour grands calculs : UALink 1.0 se dévoile
Les hyperscalers et les entreprises veulent pouvoir router leurs traitements dans les clusters de GPU en passant par autre chose que le système NVLink propriétaire de Nvidia. UALink est la réponse d’un consortium de fournisseurs. Lire la suite
-
Actualités
16 juin 2025
IA agentique : Datadog jauge l’intérêt des clients
Lors de son événement DASH 2025, Datadog a sans surprise mis l’accent sur ses annonces dédiées à l’IA générative et agentique. Hormis ses assistants IA, beaucoup de fonctionnalités sont encore en préversion. De fait, ses clients sont tiraillés quant à leur stratégie IA, tandis que l’éditeur n’a pas fixé la tarification de ses agents IA. Lire la suite
-
Actualités
16 juin 2025
Le cloud OCI achète déjà 130 000 exemplaires du dernier GPU d’AMD
Oracle revendique que son cloud public sera le premier à proposer des services d’IA basés sur le MI355X. Ils seront deux fois moins chers que ceux motorisés par des GPU Nvidia. Lire la suite
-
Actualités
13 juin 2025
Puces pour l’IA : AMD dévoile son GPU MI350X
Le constructeur prétend lancer la meilleure alternative aux GPU Blackwell de Nvidia. Son GPU MI350X peut charger des LLM de plus grande taille qu’un B200, avec une précision de 6 bits inédite qui autorise de meilleurs compromis en inférence. Lire la suite
-
Actualités
12 juin 2025
Avec Mistral AI, Nvidia s’affiche en fer de lance de l’IA souveraine
En soutenant l’IA souveraine, Nvidia entend bien maintenir son quasi-monopole en Europe dans la fourniture d’infrastructures dédiées à l’IA, et plus largement à la simulation par ordinateur. Lire la suite
-
Actualités
10 juin 2025
« From Chip to Cloud » et vice-versa : la stratégie de Microsoft en matière d’IA locale
Pour Microsoft, l’IA générative et agentique est un coup de fouet à la vente d’ordinateurs en entreprise. Peu importe le form factor, le chipset qui le propulse, l’appareil confié aux collaborateurs doit être prêt pour l’IA. Car les modèles de langage et de machine learning ne sont pas voués à rester sur le cloud. Lire la suite
-
Actualités
10 juin 2025
Untether AI, Brium et Enosemi : les rachats d’AMD pour rattraper Nvidia
Si Enosemi ne doit servir qu’à perfectionner les réseaux d’entraînement de LLM en datacenters, les deux autres startups permettront à AMD de progresser significativement dans l’optimisation des IA pour les entreprises. Lire la suite
-
Actualités
06 juin 2025
Semiconducteurs : Les USA réduisent la voilure du CHIPS Act
L’administration Trump annonce revoir à la baisse les subventions déjà consenties dans le cadre de ce plan d’investissement de 52,7 milliards de dollars, voté sous Joe Biden pour relancer l’industrie des semiconducteurs sur le sol américain. Lire la suite
-
Actualités
03 juin 2025
Puces IA : EnCharge AI lance une alternative à Qualcomm
Dans la catégorie des accélérateurs pour PC, la puce EN100 de la startup américaine n’est pas intrinsèquement plus puissante que le Cloud AI 100 de Qualcomm, mais elle est beaucoup moins énergivore. Ce qui permet de pousser sa fréquence. Lire la suite
-
Actualités
23 mai 2025
Michael Dell milite pour l’essor des IA privées
Le patron de Dell estime que trop de fournisseurs informatiques travaillent à équiper les centres de calcul géants. Selon lui, les entreprises préfèrent déployer une IA personnalisée, d’appoint, entre leurs murs. Lire la suite
par- Yann Serra, LeMagIT
- Tim McCarthy, Former News Writer
-
Actualités
21 mai 2025
PC : Dell dévoile une gamme pour l’IA de pointe sur le bureau
Les nouvelles stations portables Dell Pro Max AI devraient arriver d’ici à la fin de l’année avec la capacité d’utiliser gratuitement, sans passer par le cloud, des LLM de 30 à 109 milliards de paramètres, selon la configuration. Lire la suite
-
Actualités
20 mai 2025
Nvidia interconnecte les GPU des hyperscalers avec DGX Cloud Lepton
Nouvelle mouture du courtier Lepton AI racheté en avril dernier, le service en ligne permet à Nvidia de commercialiser des clusters de calcul virtuels qui n’ont pas de limite de capacité puisqu’ils piochent des ressources chez différents hyperscalers. Lire la suite
-
Actualités
20 mai 2025
Dell dévoile les premiers serveurs Blackwell pour l’entreprise
Allant bien au-delà de l’unique configuration présentée par Nvidia, Dell commercialise des serveurs équipés des derniers GPU B300, qui fonctionnent avec des processeurs x86 traditionnels et peuvent même être refroidis par simple ventilation. Lire la suite
-
Actualités
28 avr. 2025
L’impact énergétique de l’IA, une affaire de données
Lors de la conférence ChangeNow, James Martin (fondateur de BetterTech) et Axelle Lemaire (directrice développement durable chez Sopra Steria) ont réclamé à OpenAI de transmettre les données sur la consommation énergétique réelle de ses services. Un exercice difficile qui transparaît dans un rapport mené par l’agence internationale de l’énergie. Lire la suite
-
Actualités
23 avr. 2025
GPU : Huawei lance ses alternatives aux puces de Nvidia
En Chine, le constructeur va successivement lancer une puce moins puissante que le H100, mais livrée dans des machines plus performantes que les derniers clusters de Nvidia, puis un modèle Ascend 920 qui égale ses performances. Lire la suite
-
Actualités
22 avr. 2025
Cloud souverain : un service Kubernetes chez OUTSCALE
La filiale cloud de Dassault Systèmes renforce son offre souveraine avec « OKS », une offre Kubernetes managée, sur une infrastructure certifiée SecNumCloud. OUTSCALE vise les workloads critiques des entreprises et du secteur public, ainsi que les projets d’Intelligence artificielle. Lire la suite
-
Actualités
15 avr. 2025
Un accès WAN, un nouveau TPU et de l’IA sur site chez GCP
Les offres d’infrastructure du cloud de Google s’enrichissent d’une appliance hyperconvergée équipée des derniers GPU de Nvidia, pour exécuter localement l’IA Gemini, des puces accélératrices Ironwood et de fibres dédiées. Lire la suite
-
Opinion
11 avr. 2025
Pourquoi Apple Intelligence a besoin d’ouverture
Pour leurs premiers pas, les fonctions d’IA générative de macOS, iOS et iPadOS souffrent d’un éventail de cas d’usage limité. Sans compter l’extension exclusive à ChatGPT et l’absence d’accès à ces fonctions pour les développeurs. Lire la suite
-
Opinion
10 avr. 2025
Cybersécurité : comment ESET utilise l’IA locale sur PC
Si les PC embarquant de l’intelligence artificielle sont porteurs de promesses, les cas d’utilisation concrets ne sont pas encore très nombreux. ESET se distingue là avec des applications plus concrètes. Lire la suite
-
Actualités
07 avr. 2025
Llama 4 : Meta s’inspire de ses concurrents chinois
Le géant des réseaux sociaux met ses moyens importants à profit pour entraîner des LLM dotés d’une architecture Mixture of Experts. Largement inspiré de DeepSeek et Alibaba, le travail effectué n’empêche pas certains reproches concernant les performances des LLM et leur ouverture. Lire la suite
-
Opinion
07 avr. 2025
La sécurité pourrait être le cas d’utilisation dont les PC IA ont besoin
Les PC qui embarquent de l’intelligence artificielle ont eu du mal à trouver un cas d’utilisation parfait, mais le besoin de systèmes de sécurité plus solides sur les postes de travail pour aider. Lire la suite
-
Actualités
30 mars 2025
Stockage : les solutions certifiées par Nvidia lors de la GTC 2025
DDN, Dell, HPE, Hitachi Vantara, NetApp, Pure Storage, Vast Data et Weka ont désormais chacun des solutions officiellement compatibles avec les clusters de calcul de nouvelle génération de Nvidia. Lire la suite
-
Actualités
27 mars 2025
Stations de travail : HP lance des modèles pour l’IA sur site
Le fabricant met à jour ses petites stations graphiques avec des modèles équipés d’une toute nouvelle puce d’AMD, le Ryzen AI Max, un SoC qui reprend les bonnes idées des Mac pour accélérer l’IA. Le public visé va désormais au-delà des professionnels de l’image. Lire la suite
-
Actualités
24 mars 2025
GTC2025 : « Nvidia recentre sa production sur les GPU haut de gamme »
Malgré un catalogue a priori aussi riche qu’auparavant, les nouveaux GPU Blackwell ne seront d’abord disponibles que sur un nombre très limité de modèles. Le très haut de gamme GB200 pour les hyperscalers et des cartes RTX pour le reste du monde. Lire la suite
-
Actualités
19 mars 2025
GTC2025 : Nvidia améliore déjà ses GPU Blackwell
Alors que les modèles B100 et B200 sortent à peine d’usine, le fabricant dévoile déjà un GPU B300 50 % plus rapide. Un système d’orchestration Dynamo, qui optimise leur fonctionnement, et des versions pour stations de travail sont aussi dévoilés. Lire la suite
-
Actualités
14 mars 2025
IA embarquée : Qualcomm rachète Edge Impulse
Qualcomm met la main sur Edge Impulse, l’éditeur californien d’une plateforme d’entraînement et de déploiement de modèles d’IA sur des équipements IoT. Un moyen d’étoffer son portfolio grandissant et de rendre tangible « l’Edge GenAI ». Lire la suite
-
Actualités
13 mars 2025
Command A : Cohere réduit lui aussi l’empreinte GPU de ses LLM
Le Canadien Cohere a présenté Command A, un modèle de 111 milliards de paramètres. Ce LLM conçu pour s’exécuter sur site tient sur deux GPU Nvidia H100 ou A100 et doit répondre aux besoins des entreprises. Lire la suite
-
Actualités
12 mars 2025
Gemma 3 : Google lance des modèles frugaux dédiés aux développeurs
Les modèles Gemma 3 sont multilingues, multimodaux, traitent plus de données tout en ne réclamant qu’un seul GPU pour s’exécuter. Ce faisant, les équipes de Google DeepMind ciblent les développeurs. Lire la suite
-
Actualités
12 mars 2025
À la rencontre d’Alps, le second plus puissant supercalculateur d’Europe
Dans cette interview, Thomas Schulthess, directeur du CSCS et professeur de physique informatique à l’ETH, explique le développement de l’un des supercalculateurs les plus rapides au monde, l’Alps, déployé sur le sol suisse. Lire la suite
-
Actualités
06 mars 2025
IA : CoreWeave s’apprête à acquérir Weights & Biases
Dans la foulée de l’annonce de son dépôt de dossier d’introduction en bourse, le spécialiste des infrastructures GPU a annoncé sa volonté d’acquérir Weights & Biases, l’éditeur d’une plateforme de mise en production des modèles d’IA. Lire la suite
