Hardware IA (GPU, FPGA, etc.)
-
Actualités
22 déc. 2025
LLM : Google cherche la clé qui ouvre la porte de l’entraînement en continu
Chez Google Research, une petite équipe de quatre personnes jettent les bases théoriques et pratiques de ce que pourrait être l’héritière de la fameuse architecture Transformer. Elle concentre ses travaux sur les très longues fenêtres de contexte (plus de 2 millions de tokens) et l’apprentissage véritablement en continu. Lire la suite
-
Guide
16 déc. 2025
Dossier AWS re:Invent 2025 : ce qu’il faut en retenir
Ce dossier regroupe les principales annonces en matière d’IaaS, d’IA et de données qu’AWS a faites lors de la dernière édition de son événement annuel. Des entreprises françaises y témoignent des raisons qui les ont incitées à choisir l’hyperscaler. Lire la suite
- Renforcez la cybersécurité des établissements de santé –Webcast
- Accès rapide et sécurisé aux systèmes de santé locaux et nationaux en France –Livre Blanc
- Gestion des accès d'entreprise avec authentification multifacteur (MFA) –Analyse
-
Dans ce numéro:
- Comment calculer le ROI de la cybersécurité pour le PDG et le conseil d’administration
- Ready for IT : quel ROI pour la cybersécurité ?
- Mettre en œuvre une stratégie de sécurité basée sur les risques en 5 étapes
-
Actualités
12 déc. 2025
IA sur site : l’offre de Dell séduit sur fond d’explosion des prix
Depuis l’année dernière, Dell propose une stack pour déployer l’IA derrière les murs d’une organisation. Elle a convaincu 200 clients en France. Mais avec les grands chantiers des hyperscalers qui provoquent une tension sur les composants, ses prix vont augmenter. Fortement. Lire la suite
-
Actualités
08 déc. 2025
DBaaS : AWS met l’accent sur la maîtrise des coûts
Pour conserver les clients qui exploitent ses services de bases de données, lors de salon re:Invent 2025, le géant du cloud a multiplié les optimisations et les offres commerciales. Lire la suite
-
Actualités
04 déc. 2025
Amazon Nova 2 : quatre LLM multimodaux pour rattraper Google Cloud
Lors de re:Invent 2025 à Las Vegas, AWS a présenté Amazon Nova 2, la deuxième itération de sa collection de grands modèles de langage, la troisième en deux ans. S’il ne cherche plus à casser les prix, le fournisseur tient à convaincre ses clients d’adopter des modèles légèrement en deçà de leurs concurrents, notamment Gemini 3 Pro, mais personnalisables. Lire la suite
-
Actualités
03 déc. 2025
Re:Invent 2025 : AWS dévoile ses nouvelles infrastructures pour l’IA
L’hyperscaler dote son cloud IaaS EC2 de nouvelles configurations basées sur son GPU Trainium3 et d’autres sur les derniers GPU de Nvidia. Deux technologies d’abord concurrentes, mais qui semblent vouées à se combiner. Lire la suite
-
Actualités
03 déc. 2025
Mistral 3 : Mistral AI veut faire jeu égal avec ses compétiteurs chinois
Le fournisseur de LLM lance Mistral 3, une collection de modèles open weight répartis en deux volets : un grand modèle prévu pour s’exécuter dans le cloud et trois petits LLM parés pour l’inférence locale. Mistral AI ne bat pas ses concurrents, mais garde son rang auprès de Qwen d’Alibaba, DeepSeek, Kimi et Google Gemma. Lire la suite
-
Guide
01 déc. 2025
Dossier réseau : quelle infrastructure pour l’IA ?
S’équiper de serveurs ultra-performants ne suffira pas à exécuter les projets d’IA. Il faut aussi qu’ils puissent communiquer très rapidement des données entre eux et vers les baies de disques. Ce dossier fait le point sur les offres de réseau pour l’IA. Lire la suite
-
Actualités
27 nov. 2025
Météo France : plus d'IA pour mieux prédire les événements extrêmes
Pour Météo France, l’IA promet d’optimiser les prévisions météorologiques. Toutefois, son adoption pose plusieurs défis en matière de compétences, d’accès aux ressources de calcul, de mix entre modèles physiques et d’IA. Lire la suite
-
Actualités
24 nov. 2025
DRAM, SSD : attention à la pénurie qui se prépare
Les hyperscalers et les fabricants de serveurs commandent trop de composants mémoire pour leurs infrastructures d’IA, plus que ce que le marché peut produire. Résultat : les prix explosent dès ce mois-ci et une pénurie pourrait s’installer jusqu’en 2027. Lire la suite
-
Projet IT
21 nov. 2025
Adoption de l’IA générative : BPCE fait un (gros) point d’étape
BPCE a largement mis à disposition des assistants IA aux mains de ses collaborateurs. Alors qu’il récolte les premiers fruits de son programme, le groupe prépare prudemment l’intégration de ses premiers agents IA. Lire la suite
-
Actualités
20 nov. 2025
Inférence IA à haute vitesse : OVHcloud choisit SambaNova
OVHcloud s’associe à SambaNova dans un partenariat non exclusif. Cette startup de la Silicon Valley développe des puces reprogrammables câblées pour l’inférence rapide des modèles de langage. Et ce, tout en étant moins énergivores que les GPU Nvidia. Lire la suite
-
Actualités
14 nov. 2025
IA sur Kubernetes : les analystes épinglent la CNCF face à l’hégémonie de Nvidia
La CNCF positionne Kubernetes comme une infrastructure standard pour l’IA, mais les analystes s’interrogent sur le niveau de participation d’un acteur majeur de l’IA à son nouveau programme de conformité : Nvidia. Lire la suite
par- Beth Pariseau, TechTarget
- Gaétan Raoul, LeMagIT
-
Actualités
14 nov. 2025
Processeurs : en pleine forme, AMD travaille ses ambitions
Selon ses derniers résultats, AMD vend plus de processeurs qu’Intel dans les serveurs, mais reste en deçà dans les PC. Sa PDG se fixe des objectifs pour ne pas se faire dépasser par les puces ARM et entend progresser sur les PC comme dans l’IA. Lire la suite
-
Guide
28 oct. 2025
NetApp Insight 2025 : tout ce qu’il faut en retenir
Ce dossier regroupe toutes les annonces et les informations relatives au fabricant de baies de stockage NetApp qui ont été discutées lors de sa dernière conférence annuelle : sa stratégie globale, son approche de l’IA, son écosystème et ses nouveaux produits. Lire la suite
-
Actualités
23 oct. 2025
Les grandes tendances technologiques de 2026 selon Gartner
Les analystes de Gartner dévoilent les principales tendances technologiques que les DSI doivent connaître pour 2026, notamment le développement de l’IA, la cybersécurité et le rapatriement des données. D’autres éléments de la liste sont plus prospectifs. Lire la suite
par- Jim O'Donnell, Journaliste ERP
- Gaétan Raoul, LeMagIT
-
Actualités
20 oct. 2025
NetApp et Intel présentent l’appliance d’IA d’appoint AIPod Mini
La petite machine se veut une solution immédiatement utilisable, rapide, sécurisée et économiquement avantageuse, pour exécuter sur site des IA qui tiennent compte des données privées des entreprises. Lire la suite
-
Actualités
17 oct. 2025
IA souveraine : T-Systems achète 10 000 GPU à NVIDIA pour un cloud européen
Les deux groupes ont annoncé la création d’une infrastructure européenne, hébergée en Allemagne, dédiée à l’intelligence artificielle. Sa mise en service est prévue pour 2026. Lire la suite
par- Yann Serra, LeMagIT
- Philippe Ducellier, Rédacteur en chef adjoint
-
Actualités
16 oct. 2025
Oracle adapte son réseau pour gérer des HPC de plus de 130 000 GPU
Avec Acceleron, Oracle veut interconnecter les salles et les bâtiments bardés de rack GPU dans ses data centers, tout en économisant de l’espace et l’énergie consommée par le réseau, pour ajouter davantage de puces IA. Lire la suite
-
Actualités
16 oct. 2025
Intel relance ses GPU, mais juste pour l’inférence
Intel présente un design de cluster de calcul pour l’IA similaire aux DGX NVL72 de Nvidia, qui ne permet pas d’entraîner des AI, mais consomme moins d’énergie pour les utiliser. Il est basé sur sa puce Gaudi3. Lire la suite
-
Guide
10 oct. 2025
IA : le guide des équipements serveur pour votre datacenter
Plateformes prêtes à l’emploi, clusters de serveurs, GPU… Ce guide présente les solutions d’infrastructure du moment pour exécuter les calculs de vos intelligences artificielles. Mais attention : un risque de pénurie les guette. Lire la suite
-
Actualités
07 oct. 2025
Datacenters IA : OpenAI va acheter pour 6 GW de GPU à AMD
L’éditeur de ChatGPT s’était précédemment engagé à acheter l’équivalent de 10 GW de puissance électrique en GPU au concurrent Nvidia. La dépense totale en puces d’IA est estimée à 500 milliards de dollars. Une somme qu’OpenAI n’a pas. Lire la suite
-
Actualités
06 oct. 2025
Granite 4.0 : IBM veut écraser la concurrence sur le terrain de l’inférence
Le géant de l’IT hybride les techniques, pour obtenir des SLM et des LLM plutôt performants et peu gourmands. Il oriente également leur entraînement vers l’IA agentique, quitte à perdre en transparence. Lire la suite
-
Actualités
02 oct. 2025
Taiwan refuse de partager la production de puces d’IA avec les USA
Alors que le gouvernement des USA se targue de négocier avec Taiwan le transfert sur son sol de la moitié de la production des puces de TSMC, la vice-première ministre taiwanaise rétorque qu’elle n’était pas au courant et qu’elle s’oppose même à une telle idée. Lire la suite
-
Actualités
23 sept. 2025
Nvidia : l’étrange investissement de 100 milliards à la faveur d’OpenAI
Cet investissement doit permettre à OpenAI de déployer des millions de GPU nécessaires au fonctionnement de son IA GPT. Ce déploiement se fera dans des datacenters avec lesquels Nvidia passe aussi des accords, au bénéfice de son action en bourse. Lire la suite
-
Actualités
22 sept. 2025
LLM-as-a-Service : Scaleway propose ses services d’inférence depuis Hugging Face
Jusqu’alors, Hugging Face avait connecté sa plateforme avec les services d’inférence de néocloud. Scaleway est le premier fournisseur français à se connecter à la bibliothèque de modèles d’IA open weight. Lire la suite
-
Actualités
22 sept. 2025
Infrastructure IA : Nvidia rachète Enfabrica
Le contrôleur CXL de la startup doit permettre à plusieurs GPU de partager une extension mémoire externe, accélérant l’entraînement des IA et rendant plus élastique l’inférence. Étonnamment, cette extension serait reliée par Ethernet. Lire la suite
-
Actualités
18 sept. 2025
Puces IA : la Chine ne veut plus de Nvidia
Dans la guerre économique qui l’oppose aux USA, la Chine a décidé de ne plus dépendre des GPU américains, d’autant que son champion Huawei a désormais des solutions pour développer ses IA. Nvidia accuse le coup. Lire la suite
-
Actualités
17 sept. 2025
Chez HPE, les ventes de serveurs progressent aussi
Comme Dell, HPE se félicite du succès de ses nouvelles machines configurées pour l’IA dans les datacenters. Une dynamique que tardent à suivre les solutions de stockage. Comme partout ailleurs. Lire la suite
-
Actualités
15 sept. 2025
Puces IA : SK Hynix lance la production des mémoires HBM4
Ce nouveau type de mémoire contribuera aux deux tiers des gains de performances qu’afficheront les prochains GPU. Pour SK Hynix, il s’agit surtout d’une avancée considérable face à Samsung, l’actuel leader des composants mémoires. Lire la suite
- 12 sept. 2025
-
Actualités
10 sept. 2025
Puces IA : Nvidia dévoile le Rubin CPX pour l’inférence
Le constructeur a dévoilé les caractéristiques probables du GPU qu’il lancera d’ici à la fin de l’année 2026 pour accélérer l’inférence. Lire la suite
-
Actualités
08 sept. 2025
Le Sénat américain propose d’interdire la vente de GPU en Europe
Une proposition de loi suggère que le barème TPP, qui empêche les GPU classiques d’entrer en Chine, s’applique à l’ensemble du monde. L’Europe serait dès lors condamnée à utiliser les services des hyperscalers américains pour travailler avec l’IA. Lire la suite
-
Actualités
27 août 2025
Nvidia commercialise son GPU Blackwell pour PME
Le GPU RTX Pro 6000 Blackwell Server Edition permet au tout venant des entreprises de bénéficier dans leur salle informatique, sur des serveurs d’appoint, de la puissance en IA des grands datacenters. Lire la suite
par- Yann Serra, LeMagIT
- Shane Snider, Senior News Writer
-
Guide
25 août 2025
Dossier : comment les USA régulent le marché des puces pour l’IA
Ce dossier répertorie toutes les clés pour comprendre la stratégie étatsunienne en matière de semiconducteurs de pointe. Les USA veulent en réglementer le commerce et s’en servir pour conforter leur suprématie en intelligence artificielle. Lire la suite
-
Actualités
22 août 2025
Empreinte écologique de l'IA générative : Google tente d’éteindre le feu
Dans un billet technique, Google affirme que l’empreinte énergétique de son IA générative Gemini serait largement inférieure aux estimations publiques alarmistes. Google y détaille sa méthodologie de calcul et revendique des gains d’efficacité sur les douze derniers mois. Mais la transparence n’est pas encore là. Lire la suite
-
Actualités
14 août 2025
Cosmos : Nvidia parie sur l’application de l’IA dans le monde physique
Avec ses modèles de monde Cosmos, le spécialiste fabless des GPU et de l’IA entend favoriser le développement de systèmes robotiques capables de planifier et d’exécuter des tâches de manière autonome. Lire la suite
par- Esther Shittu, News Writer
- Gaétan Raoul, LeMagIT
-
Actualités
12 août 2025
AMD et Nvidia reverseront 15 % de leurs revenus engrangés en Chine à l’Administration américaine
Cette mesure sans précédent prise par l’Administration Trump pourrait entrer en conflit avec les dispositions de la Constitution américaine interdisant les taxes à l’exportation. Lire la suite
par- Shane Snider, Senior News Writer
- La Rédaction
-
Actualités
08 août 2025
Donald Trump veut imposer 100 % de droits de douane sur les semiconducteurs
Le secteur des puces électroniques est bouleversé par les projets de l’Administration américaine d’imposer des droits de douane sur les semiconducteurs importés aux États-Unis. Lire la suite
-
Actualités
01 août 2025
OpenAI lance un Stargate norvégien sur fond de divorce avec Microsoft
D’ici à fin 2026, OpenAI fera héberger son IA GPT sur les 100 000 GPUs d’un datacenter au nord du continent, bâti par Nscale et Aker pour tout à fait autre chose. Mais pour OpenAI, il y a l’enjeu de maintenir une présence en Europe en dehors des datacenters d’Azure. Lire la suite
-
Actualités
29 juil. 2025
IA : Huawei dévoile son cluster de calcul rival de Nvidia
Le CloudMatrix 384 occupe 16 fois plus d’espace au sol et consomme 5 fois plus d’électricité que le DGX B200 NVL72 de Nvidia. Mais il est 70 % plus performant, permet d’entraîner des modèles 3,6 fois plus complexes et se contente d’un refroidissement par air. Lire la suite
-
Actualités
29 juil. 2025
L’inférence distribuée, l’avenir de Red Hat AI
Red Hat, filiale d’IBM, croit qu’elle a un rôle à jouer dans le déploiement de systèmes hybrides d’IA. Outre la commercialisation de vLLM, l’éditeur mise sur le projet d’inférence IA distribuée, llm-d. Lire la suite
-
Actualités
23 juil. 2025
L’Administration Trump lance un nouveau plan pour l’IA
Il n’est plus question de Stargate. Le nouveau plan d’action américain pour l’IA tout juste dévoilé par l’administration Trump vise à déréguler les chantiers de datacenters aux USA et à réglementer l’IA selon ses objectifs pour le reste du monde. Lire la suite
-
Actualités
23 juil. 2025
Bilan environnemental des LLM : ce que révèle l’étude de Mistral AI
Le fournisseur de LLM français entend offrir davantage de transparence à ses clients en commençant par l’analyse du cycle de vie de son plus gros LLM, Mistral Large 2. L’exercice met en lumière les défauts des estimations des concurrents… et de celles de Mistral AI. Lire la suite
-
Actualités
23 juil. 2025
Infrastructures IA : OpenAI signe des contrats qui jettent le flou sur Stargate
L’éditeur de ChatGPT, au cœur du projet Stargate pour la suprématie des USA en intelligence artificielle, semble faire le tour des hébergeurs américains pour son propre compte et lance des chantiers de datacenters étiquetés Stargate au Moyen-Orient. Lire la suite
-
Actualités
21 juil. 2025
On-premise, edge, multicloud : Clarifai veut unifier l’inférence des modèles d’IA
L’expert de la computer vision s’appuie sur sa plateforme afin de proposer un centre de contrôle des modèles d’IA générative et des agents IA. Son atout majeur ? La possibilité de déployer des charges de travail sur site, dans plusieurs clouds et en local depuis une seule interface Lire la suite
-
Actualités
16 juil. 2025
Semiconducteurs : de retour en Chine, Nvidia affiche son double jeu
Le fabricant de GPU a de nouveau le droit de vendre ses accélérateurs H20 pour entraîner les IA chinoises. D’un côté, Jensen Huang dit œuvrer au succès américain face à Huawei. De l’autre, il fait tout pour que Tencent, Alibaba et ByteDance rivalisent avec les IA occidentales. Lire la suite
-
Actualités
11 juil. 2025
Infrastructure IA : l’onde de choc CoreWeave
Autrefois mineur de cryptomonnaies, le fournisseur CoreWeave a pris la vague de l’IA générative. Une vague qui fait désormais déferler ses services « GPU on demand » jusque sur les côtes européennes. Lire la suite
-
Actualités
10 juil. 2025
Groq déploie son cloud et ses serveurs d’inférence IA en Europe
Groq installe ses serveurs d’inférence IA et sa plateforme logicielle dans un data center appartenant à Equinix à Helsinki, en Finlande. Le fournisseur espère ainsi convaincre les entreprises européennes d’adopter ses services. Lire la suite
-
Actualités
09 juil. 2025
Photons + neurones : un duo franco-québécois à la conquête de l’IA quantique
La pépite française spécialiste du calcul photonique, Quandela s’allie à l’Institut québécois d’intelligence artificielle (Mila) pour développer des solutions qui combineront IA et informatique quantique. Un moyen également pour Quandela de continuer son implantation internationale au Canada. Lire la suite
-
Actualités
08 juil. 2025
IA : Phison utilise la capacité des SSD pour étendre la RAM des GPU
Avec ses logiciels aiDaptive+ et ses SSD PASCARI, Phison permet à de simples machines personnelles d’accéder à des fonctions de pointe jusqu’ici réservées aux datacenters, notamment le fine-tuning de grands modèles. Lire la suite
par- Stéphane Larcher, LeMagIT
- Yann Serra, LeMagIT
-
Actualités
02 juil. 2025
IA locale : Microsoft veut confier le paramétrage de Windows 11 à un SLM
Le petit modèle de langage Mu (à peine 330 millions de paramètres) a été entraîné pour effectuer de petites tâches en local, sur un NPU. Par exemple, pour régler les options de Windows 11. Lire la suite
-
Actualités
25 juin 2025
IA privée et « souveraine » : Teradata lance AI Factory
Pour les entreprises préoccupées par le contrôle des coûts du cloud et la souveraineté des données, la nouvelle plateforme du fournisseur de longue date promet aux utilisateurs de construire des outils d’IA avancés au sein de leurs propres systèmes. Lire la suite
par- Gaétan Raoul, LeMagIT
- Eric Avidon, TechTarget
-
Guide
20 juin 2025
Dossier infrastructure : l’essentiel de Dell Tech World 2025
Surfant sur la nécessité d’utiliser l’IA dans des datacenters privés, le constructeur a multiplié lors de sa dernière conférence mondiale les approches originales pour se passer des infrastructures des hyperscalers. Lire la suite
-
Actualités
17 juin 2025
IA : la CNCF entrevoit une alternative ouverte à CUDA de Nvidia
Les leaders de l’open source soulignent les avancées de projets tels que OpenTelemetry et discutent du rôle de la communauté open source, dans l’élaboration de l’avenir des charges de travail d’intelligence artificielle et dans la promotion de la collaboration mondiale dans un contexte de tensions géopolitiques. Lire la suite
par- Aaron Tan, Informa TechTarget
- Gaétan Raoul, LeMagIT
- 17 juin 2025
-
E-Zine
17 juin 2025
Storage 40 – Stockage accéléré : les dernières solutions pour épauler l’IA
Dans ce nouveau numéro, Storage explore les dernières solutions de stockage accéléré pour répondre aux exigences de l’IA. Le magazine met en lumière les innovations, les performances extrêmes et stratégies hybrides des acteurs majeurs comme Nvidia, Huawei, Pure Storage, Hammerspace ou Scality. Lire la suite
-
Actualités
16 juin 2025
Réseau pour grands calculs : UALink 1.0 se dévoile
Les hyperscalers et les entreprises veulent pouvoir router leurs traitements dans les clusters de GPU en passant par autre chose que le système NVLink propriétaire de Nvidia. UALink est la réponse d’un consortium de fournisseurs. Lire la suite
-
Actualités
16 juin 2025
IA agentique : Datadog jauge l’intérêt des clients
Lors de son événement DASH 2025, Datadog a sans surprise mis l’accent sur ses annonces dédiées à l’IA générative et agentique. Hormis ses assistants IA, beaucoup de fonctionnalités sont encore en préversion. De fait, ses clients sont tiraillés quant à leur stratégie IA, tandis que l’éditeur n’a pas fixé la tarification de ses agents IA. Lire la suite
-
Actualités
16 juin 2025
Le cloud OCI achète déjà 130 000 exemplaires du dernier GPU d’AMD
Oracle revendique que son cloud public sera le premier à proposer des services d’IA basés sur le MI355X. Ils seront deux fois moins chers que ceux motorisés par des GPU Nvidia. Lire la suite
-
Actualités
13 juin 2025
Puces pour l’IA : AMD dévoile son GPU MI350X
Le constructeur prétend lancer la meilleure alternative aux GPU Blackwell de Nvidia. Son GPU MI350X peut charger des LLM de plus grande taille qu’un B200, avec une précision de 6 bits inédite qui autorise de meilleurs compromis en inférence. Lire la suite
-
Actualités
12 juin 2025
Avec Mistral AI, Nvidia s’affiche en fer de lance de l’IA souveraine
En soutenant l’IA souveraine, Nvidia entend bien maintenir son quasi-monopole en Europe dans la fourniture d’infrastructures dédiées à l’IA, et plus largement à la simulation par ordinateur. Lire la suite
-
Actualités
10 juin 2025
« From Chip to Cloud » et vice-versa : la stratégie de Microsoft en matière d’IA locale
Pour Microsoft, l’IA générative et agentique est un coup de fouet à la vente d’ordinateurs en entreprise. Peu importe le form factor, le chipset qui le propulse, l’appareil confié aux collaborateurs doit être prêt pour l’IA. Car les modèles de langage et de machine learning ne sont pas voués à rester sur le cloud. Lire la suite
-
Actualités
10 juin 2025
Untether AI, Brium et Enosemi : les rachats d’AMD pour rattraper Nvidia
Si Enosemi ne doit servir qu’à perfectionner les réseaux d’entraînement de LLM en datacenters, les deux autres startups permettront à AMD de progresser significativement dans l’optimisation des IA pour les entreprises. Lire la suite
-
Actualités
06 juin 2025
Semiconducteurs : Les USA réduisent la voilure du CHIPS Act
L’administration Trump annonce revoir à la baisse les subventions déjà consenties dans le cadre de ce plan d’investissement de 52,7 milliards de dollars, voté sous Joe Biden pour relancer l’industrie des semiconducteurs sur le sol américain. Lire la suite
-
Actualités
03 juin 2025
Puces IA : EnCharge AI lance une alternative à Qualcomm
Dans la catégorie des accélérateurs pour PC, la puce EN100 de la startup américaine n’est pas intrinsèquement plus puissante que le Cloud AI 100 de Qualcomm, mais elle est beaucoup moins énergivore. Ce qui permet de pousser sa fréquence. Lire la suite
-
Actualités
23 mai 2025
Michael Dell milite pour l’essor des IA privées
Le patron de Dell estime que trop de fournisseurs informatiques travaillent à équiper les centres de calcul géants. Selon lui, les entreprises préfèrent déployer une IA personnalisée, d’appoint, entre leurs murs. Lire la suite
par- Yann Serra, LeMagIT
- Tim McCarthy, Former News Writer
-
Actualités
21 mai 2025
PC : Dell dévoile une gamme pour l’IA de pointe sur le bureau
Les nouvelles stations portables Dell Pro Max AI devraient arriver d’ici à la fin de l’année avec la capacité d’utiliser gratuitement, sans passer par le cloud, des LLM de 30 à 109 milliards de paramètres, selon la configuration. Lire la suite
-
Actualités
20 mai 2025
Nvidia interconnecte les GPU des hyperscalers avec DGX Cloud Lepton
Nouvelle mouture du courtier Lepton AI racheté en avril dernier, le service en ligne permet à Nvidia de commercialiser des clusters de calcul virtuels qui n’ont pas de limite de capacité puisqu’ils piochent des ressources chez différents hyperscalers. Lire la suite
-
Actualités
20 mai 2025
Dell dévoile les premiers serveurs Blackwell pour l’entreprise
Allant bien au-delà de l’unique configuration présentée par Nvidia, Dell commercialise des serveurs équipés des derniers GPU B300, qui fonctionnent avec des processeurs x86 traditionnels et peuvent même être refroidis par simple ventilation. Lire la suite
-
Actualités
28 avr. 2025
L’impact énergétique de l’IA, une affaire de données
Lors de la conférence ChangeNow, James Martin (fondateur de BetterTech) et Axelle Lemaire (directrice développement durable chez Sopra Steria) ont réclamé à OpenAI de transmettre les données sur la consommation énergétique réelle de ses services. Un exercice difficile qui transparaît dans un rapport mené par l’agence internationale de l’énergie. Lire la suite
-
Actualités
23 avr. 2025
GPU : Huawei lance ses alternatives aux puces de Nvidia
En Chine, le constructeur va successivement lancer une puce moins puissante que le H100, mais livrée dans des machines plus performantes que les derniers clusters de Nvidia, puis un modèle Ascend 920 qui égale ses performances. Lire la suite
-
Actualités
22 avr. 2025
Cloud souverain : un service Kubernetes chez OUTSCALE
La filiale cloud de Dassault Systèmes renforce son offre souveraine avec « OKS », une offre Kubernetes managée, sur une infrastructure certifiée SecNumCloud. OUTSCALE vise les workloads critiques des entreprises et du secteur public, ainsi que les projets d’Intelligence artificielle. Lire la suite
-
Actualités
15 avr. 2025
Un accès WAN, un nouveau TPU et de l’IA sur site chez GCP
Les offres d’infrastructure du cloud de Google s’enrichissent d’une appliance hyperconvergée équipée des derniers GPU de Nvidia, pour exécuter localement l’IA Gemini, des puces accélératrices Ironwood et de fibres dédiées. Lire la suite
-
Opinion
11 avr. 2025
Pourquoi Apple Intelligence a besoin d’ouverture
Pour leurs premiers pas, les fonctions d’IA générative de macOS, iOS et iPadOS souffrent d’un éventail de cas d’usage limité. Sans compter l’extension exclusive à ChatGPT et l’absence d’accès à ces fonctions pour les développeurs. Lire la suite
-
Opinion
10 avr. 2025
Cybersécurité : comment ESET utilise l’IA locale sur PC
Si les PC embarquant de l’intelligence artificielle sont porteurs de promesses, les cas d’utilisation concrets ne sont pas encore très nombreux. ESET se distingue là avec des applications plus concrètes. Lire la suite
-
Actualités
07 avr. 2025
Llama 4 : Meta s’inspire de ses concurrents chinois
Le géant des réseaux sociaux met ses moyens importants à profit pour entraîner des LLM dotés d’une architecture Mixture of Experts. Largement inspiré de DeepSeek et Alibaba, le travail effectué n’empêche pas certains reproches concernant les performances des LLM et leur ouverture. Lire la suite
-
Opinion
07 avr. 2025
La sécurité pourrait être le cas d’utilisation dont les PC IA ont besoin
Les PC qui embarquent de l’intelligence artificielle ont eu du mal à trouver un cas d’utilisation parfait, mais le besoin de systèmes de sécurité plus solides sur les postes de travail pour aider. Lire la suite
-
Actualités
30 mars 2025
Stockage : les solutions certifiées par Nvidia lors de la GTC 2025
DDN, Dell, HPE, Hitachi Vantara, NetApp, Pure Storage, Vast Data et Weka ont désormais chacun des solutions officiellement compatibles avec les clusters de calcul de nouvelle génération de Nvidia. Lire la suite
-
Actualités
27 mars 2025
Stations de travail : HP lance des modèles pour l’IA sur site
Le fabricant met à jour ses petites stations graphiques avec des modèles équipés d’une toute nouvelle puce d’AMD, le Ryzen AI Max, un SoC qui reprend les bonnes idées des Mac pour accélérer l’IA. Le public visé va désormais au-delà des professionnels de l’image. Lire la suite
-
Actualités
24 mars 2025
GTC2025 : « Nvidia recentre sa production sur les GPU haut de gamme »
Malgré un catalogue a priori aussi riche qu’auparavant, les nouveaux GPU Blackwell ne seront d’abord disponibles que sur un nombre très limité de modèles. Le très haut de gamme GB200 pour les hyperscalers et des cartes RTX pour le reste du monde. Lire la suite
-
Actualités
19 mars 2025
GTC2025 : Nvidia améliore déjà ses GPU Blackwell
Alors que les modèles B100 et B200 sortent à peine d’usine, le fabricant dévoile déjà un GPU B300 50 % plus rapide. Un système d’orchestration Dynamo, qui optimise leur fonctionnement, et des versions pour stations de travail sont aussi dévoilés. Lire la suite
-
Actualités
14 mars 2025
IA embarquée : Qualcomm rachète Edge Impulse
Qualcomm met la main sur Edge Impulse, l’éditeur californien d’une plateforme d’entraînement et de déploiement de modèles d’IA sur des équipements IoT. Un moyen d’étoffer son portfolio grandissant et de rendre tangible « l’Edge GenAI ». Lire la suite
-
Actualités
13 mars 2025
Command A : Cohere réduit lui aussi l’empreinte GPU de ses LLM
Le Canadien Cohere a présenté Command A, un modèle de 111 milliards de paramètres. Ce LLM conçu pour s’exécuter sur site tient sur deux GPU Nvidia H100 ou A100 et doit répondre aux besoins des entreprises. Lire la suite
-
Actualités
12 mars 2025
Gemma 3 : Google lance des modèles frugaux dédiés aux développeurs
Les modèles Gemma 3 sont multilingues, multimodaux, traitent plus de données tout en ne réclamant qu’un seul GPU pour s’exécuter. Ce faisant, les équipes de Google DeepMind ciblent les développeurs. Lire la suite
-
Actualités
12 mars 2025
À la rencontre d’Alps, le second plus puissant supercalculateur d’Europe
Dans cette interview, Thomas Schulthess, directeur du CSCS et professeur de physique informatique à l’ETH, explique le développement de l’un des supercalculateurs les plus rapides au monde, l’Alps, déployé sur le sol suisse. Lire la suite
-
Actualités
06 mars 2025
IA : CoreWeave s’apprête à acquérir Weights & Biases
Dans la foulée de l’annonce de son dépôt de dossier d’introduction en bourse, le spécialiste des infrastructures GPU a annoncé sa volonté d’acquérir Weights & Biases, l’éditeur d’une plateforme de mise en production des modèles d’IA. Lire la suite
-
Actualités
28 févr. 2025
GPT-4.5 : un mastodonte sans avenir chez OpenAI
OpenAI a développé un LLM si gros qu’il a épuisé son lot de puces graphiques pour l’exécuter à large échelle alors que celui-ci ne représente pas un saut générationnel. La licorne pense toutefois que le travail effectué lui permettra de développer des modèles de raisonnement plus performants. Lire la suite
-
Projet IT
27 févr. 2025
Thales : voyage dans une galaxie d’IA de confiance
Au travers de son programme CortAIx, Thales a industrialisé l’intégration de l’intelligence artificielle dans les systèmes critiques, militaires ou civils. La centaine d’applications IA développées concernent notamment la sécurité des mers, la lutte anti-drone ou encore le contrôle aérien. Mais pas que. Plongée dans cette galaxie d’IA aux contraintes très strictes. Lire la suite
par- Christophe Auffray, LeMagIT
- Stéphane Larcher, LeMagIT
-
Actualités
26 févr. 2025
IA : les grands modèles consomment jusqu’à 61 000 fois plus d’énergie que les petits
L’AI Energy Score met en évidence l’énorme disparité entre les modèles de deep learning et les grands modèles de langage en matière d’énergie consommée à l’inférence. Un écart global de facteur 61 000 entre les 166 modèles testés, justifié par leur taille, mais aussi leurs différents usages. Lire la suite
-
Actualités
25 févr. 2025
Claude 3.7 Sonnet : Anthropic mise sur un modèle de raisonnement « hybride »
Avec Claude 3.7 Sonnet, Anthropic veut se différencier en proposant un LLM à la fois capable de répondre à des questions et de produire des « raisonnements ». Le fournisseur entend le proposer plus particulièrement aux développeurs. Lire la suite
-
Actualités
19 févr. 2025
Puces IA : les hébergeurs commencent à déployer les GPU d’AMD
Face à la pénurie probable de GPU Nvidia, les opérateurs de clouds privés commencent à proposer des infrastructures d’IA équipées de MI325X, la solution alternative d’AMD. Aux USA, Vultr ouvre la danse. Lire la suite
-
Actualités
18 févr. 2025
Puces IA : dix fournisseurs proposent une alternative à Nvidia
La demande actuelle pour des GPU menace de dépasser les capacités de production de Nvidia. Selon leurs besoins, les entreprises peuvent se tourner vers dix autres fournisseurs. Lire la suite
par- Yann Serra, LeMagIT
- Devin Partida, ReHack.com
-
Actualités
17 févr. 2025
Datacenters IA en France : promesses contre promesses
Pour favoriser l’implémentation de nouveaux datacenters IA en France, le gouvernement s’est engagé sur plusieurs fronts : prix et accès préférentiel à l’électricité, identification de sites, et ajustements législatifs. S’il ne promet pas l’impossible, toutes les conditions nécessaires à la réussite de ce plan ne sont pas réunies. Lire la suite
-
Actualités
17 févr. 2025
Puces pour l’IA : la production menace de ne pas suivre la demande
Les États occidentaux ont décidé d’investir des milliards pour déployer sur leurs territoires d’immenses quantités de GPU, tandis que les géants d’Internet réservent en avance la majorité de la production de Nvidia. Pendant ce temps, les usines ne fabriquent pas plus. Lire la suite
-
Actualités
13 févr. 2025
À Amsterdam, Cisco veut redevenir un leader de l’infrastructure
L’équipementier réseau arrive avec des architectures tout-en-un pour l’IA. Outre des switches Ethernet intégrant des accélérateurs de fonctions, il se relance surtout dans les serveurs, avec des configurations simples pour utiliser l’IA en entreprise. Lire la suite
-
Actualités
12 févr. 2025
Compétition et IA : les hyperscalers ont-ils pipé les dés ?
En nouant des partenariats avec les startups, les hyperscalers américains auraient déjà pris les rênes du marché de l’IA, s’alarment les ONG AI Now et Open Market Institute. Les autorités de la concurrence sont plus mesurées, mais vigilantes. Lire la suite
-
Actualités
12 févr. 2025
Sommet sur l’IA : la France et l’Union européenne répliquent (à) « Stargate »
Après que la France a annoncé 109 milliards d’euros d’investissements futurs dans des infrastructures d’IA sur son territoire, c’est au tour de la Commission européenne de « mobiliser » jusqu’à 200 milliards d’euros. Des investissements majoritairement étrangers, qui impliquent une application « favorable à l’innovation » des réglementations. Lire la suite
-
Actualités
10 févr. 2025
Sommet sur l’IA : les étoiles s’alignent pour Mistral AI
Bien conscient du souffle que représente le sommet international pour l’action sur l’IA, Mistral AI déploie la grand-voile et multiplie les annonces. La jeune pousse dirigée par Arthur Mensch bénéficie désormais du soutien gouvernemental et des grands comptes tout en rivalisant avec OpenAI aux yeux du grand public. Lire la suite
-
Actualités
10 févr. 2025
MLPerf : des tests pour mesurer objectivement les offres d’IA
Développés par l’organisation à but non lucratif MLCommons, ces benchmarks évaluent les performances des infrastructures vendues pour entraîner ou inférer des IA. Lire la suite
-
Actualités
06 févr. 2025
Infrastructure IA : Nvidia adapte son réseau rapide Spectrum-X au stockage
Les switches et les cartes réseau de Nvidia disposent d’un mode d’accélération propriétaire qui ne fonctionnait jusque-là qu’entre des serveurs de calcul. Désormais, ce mode Spectrum-X est utilisable avec les baies de stockage. DDN, Vast et Weka l’ont validé. Lire la suite
-
Actualités
05 févr. 2025
Cerebras promeut sa puce IA via un chatbot DeepSeek R1 plus rapide
En quête de visibilité pour son processeur géant WSE-3, le concepteur de semiconducteurs américain propose lui aussi en ligne un chatbot gratuit pour utiliser le LLM chinois, mais avec des réponses plus rapides qu’ailleurs. Lire la suite
