D’ailleurs, la firme de Redmond explique que certains modèles de machine learning et de computer vision s’exécutent déjà sur les PC Windows. Sur les PC Copilot+, les fonctions locales dans Windows Search, Windows Live Caption, Outlook, Teams, Recall et « Cliquer pour faire » s’appuient en partie sur des LLM locaux.

« Il n’y a pas de dichotomie. Microsoft ne peut pas confronter les deux mondes [cloud et local] : notre écosystème est évidemment hybride », déclare Anne Stoll, directrice des équipements Surface chez Microsoft France.

Pour le métier, cette transition entre les services distants et ceux qui s’exécutent depuis son ordinateur doit être « sans couture ».

Ce besoin d’IA embarquée peut se justifier par différents besoins ou cas d’usage : soulager les infrastructures cloud, assister un travailleur nomade qui n’a momentanément pas accès à Internet, aider des rôles manipulant des éléments sensibles ne devant pas être exposés au Web, etc.

« Nos clients ne peuvent pas migrer toutes leurs données vers le cloud », déclare Frédéric Wickert, senior technical GTM [go to market] Copilot+Pcs manager chez Microsoft France. « Il s’agit de répondre à des besoins spécifiques qui complètent ou remplacent les fonctionnalités des applications SaaS ». Frédéric Wickert évoque l’exemple d’hôpitaux qui ne souhaiteraient pas opter pour la solution de reconnaissance vocale Dragon puisqu’elle est hébergée sur un cloud public.

C’est ce qu’essaie de démontrer Microsoft avec l’application open source AI Dev Gallery. Celle-ci rassemble près de 25 exemples de fonctions et d’usage de modèles d’IA locaux à télécharger depuis une liste concoctée par Microsoft ou depuis Huggingface. Sous le capot, AI Dev Gallery utilise Visual Studio, Windows AI Foundry et les API Windows. De la sorte, il est possible de déployer des modèles sur des CPU, des GPU et des NPU.

Faire rimer IA avec frugalité, durabilité (et prix plus élevé)

Cette tendance justifierait de se procurer une flotte de PC Copilot+ dès maintenant. Microsoft dirait de préférence un appareil de la gamme Surface. La firme de Redmond met ainsi en avant le 2 en 1 Surface Pro 12 pouces (à partir de 979 euros) ainsi que le Surface Laptop 13 pouces (à partir de 1099 euros). Les deux machines lancées récemment sont propulsées par un SoC Snapdragon X Plus huit cœurs, couplés à 16 Go de mémoire vive et 256 à 512 Go d’espace de stockage. Et Microsoft d’insister sur le NPU Hexagon intégré au SoC de Qualcomm, capable de réaliser jusqu’à 45 TOPS (millier de milliards d’opérations par seconde). C’est cette puce qui est sollicitée par Windows AI Foundry (et par extension Dev Gallery) pour exécuter les LLM et les SLM locaux. « Nous sommes passés de 12 TOPS sur la première génération de nos PC IA en 2022 à 45 TOPS, ce qui est suffisant pour exécuter des algorithmes et de petits modèles de langage », considère Anne Toll.

Ces ordinateurs nomades propulsés par des puces Qualcomm ne sont toutefois pas pour toutes les entreprises et tous les employés. Doués d’une plus grande autonomie que les PC Intel, leur format les destine aux collaborateurs les plus nomades. Les PC équipés de puces Intel sont plus adaptés aux entreprises devant gérer la compatibilité avec des centaines, voire des milliers, de logiciels, reconnaissent les porte-parole de Microsoft France.

En outre, Microsoft s’engage à une certaine sobriété. Cela pourrait aussi être une limitation volontaire de l’usage de capacités locales. L’activité IA en cloud demeure une priorité. Dans un même temps, le géant du cloud doit s’assurer avec ses partenaires que les modèles d’IA tiendront sur un NPU doté au maximum de 48 TOPS (avec les Surface Laptop équipés d’un CPU Intel Core Ultra 7 266v et 268v) quand un GPU dédié d’entrée de gamme comme la RTX 5060 de 8 Go de VRAM affiche 648 TOPS.

La réponse actuelle de Microsoft consiste en la compression de SLM tiers et des siens à travers le volet Foundry Local de Windows AI Foundry. Pour ses propres besoins, le géant mise sur Phi-Silica, un petit modèle de langage de 3,3 milliards de paramètres entraîné et quantisé spécifiquement pour les PC Copilot+. C’est d’ailleurs un composant poussé dans les mises à jour de Windows 11 24H2.

Canalys semble donner raison à Microsoft. En janvier 2025, cette filiale d’Omdia [propriété d’Informa TechTarget, également propriétaire du MagIT] a prédit que les PC IA représenteraient 35 % du volume total de machines expédiées en 2025. Au vu de la généralisation des technologies d’IA, cette portion pourrait atteindre 70 % en 2028, dont la majorité serait des ordinateurs portables. Et comme Microsoft, Canalys anticipe une hausse des prix des équipements.

« À court terme, Canalys s’attend à une prime de prix de 10 % à 15 % sur les PC compatibles avec l’IA par rapport à des PC aux spécifications similaires sans intégration de NPU », écrivaient les analystes de Canalys en mars 2024. À cela s’ajoutent les droits de douane qui ont favorisé l’achat de machines avant leur entrée en vigueur, selon un rapport des analystes publié en avril 2025.

En même temps qu’elles envisagent de déployer des formes d’IA générative, les entreprises maintiennent de plus en plus longtemps leur parc de machines. « Auparavant, nos clients renouvelaient les équipements des salariés tous les trois à quatre ans. Aujourd’hui, nous sommes plutôt entre 4 et 5 ans, voire 6 », relate la directrice des équipements Surface chez Microsoft France.

Le groupe prend désormais au sérieux ce maintien à plus long terme des ordinateurs en entreprise. Microsoft s’engage à un support jusqu’à six ans du BIOS et des drivers. « C’est l’engagement que nous n’avions pas pris auparavant : techniquement, le firmware n’était pas mis à jour après cinq ans », avance Anne Toll.