« From Chip to Cloud » et vice-versa : la stratégie de Microsoft en matière d’IA locale
Pour Microsoft, l’IA générative et agentique est un coup de fouet à la vente d’ordinateurs en entreprise. Peu importe le form factor, le chipset qui le propulse, l’appareil confié aux collaborateurs doit être prêt pour l’IA. Car les modèles de langage et de machine learning ne sont pas voués à rester sur le cloud.
D’ailleurs, la firme de Redmond explique que certains modèles de machine learning et de computer vision s’exécutent déjà sur les PC Windows. Sur les PC Copilot+, les fonctions locales dans Windows Search, Windows Live Caption, Outlook, Teams, Recall et « Cliquer pour faire » s’appuient en partie sur des LLM locaux.
« Il n’y a pas de dichotomie. Microsoft ne peut pas confronter les deux mondes [cloud et local] : notre écosystème est évidemment hybride », déclare Anne Stoll, directrice des équipements Surface chez Microsoft France.
Pour le métier, cette transition entre les services distants et ceux qui s’exécutent depuis son ordinateur doit être « sans couture ».
Ce besoin d’IA embarquée peut se justifier par différents besoins ou cas d’usage : soulager les infrastructures cloud, assister un travailleur nomade qui n’a momentanément pas accès à Internet, aider des rôles manipulant des éléments sensibles ne devant pas être exposés au Web, etc.
Tester l’IA locale avec les clients
C’est ce qu’essaie de démontrer Microsoft avec l’application open source AI Dev Gallery. Celle-ci rassemble près de 25 exemples de fonctions et d’usage de modèles d’IA locaux à télécharger depuis une liste concoctée par Microsoft ou depuis Huggingface. Sous le capot, AI Dev Gallery utilise Visual Studio, Windows AI Foundry et les API Windows. De la sorte, il est possible de déployer des modèles sur des CPU, des GPU et des NPU.
Chez Microsoft, AI Dev Gallery permet aux représentants du groupe de développer des applications de démonstration : solutions pour le field service management, la santé, la finance, le contrôle qualité en usine à travers la caméra d’un appareil, etc.
« Nos clients ne peuvent pas migrer toutes leurs données vers le cloud », déclare Frédéric Wickert, senior technical GTM [go to market] Copilot+Pcs manager chez Microsoft France. « Il s’agit de répondre à des besoins spécifiques qui complètent ou remplacent les fonctionnalités des applications SaaS ». Frédéric Wickert évoque l’exemple d’hôpitaux qui ne souhaiteraient pas opter pour la solution de reconnaissance vocale Dragon puisqu’elle est hébergée sur un cloud public.
Les possibilités sont nombreuses, croient les représentants français de la firme de Redmond. « Nous sommes au début de l’histoire. C’est pour cela que nous faisons intervenir [des ingénieurs avant ventes] afin de réfléchir avec les entreprises à ce qu’elles peuvent imaginer aujourd’hui et demain », justifie Anne Toll. « Beaucoup d’entreprises sont intéressées, mais elles nous disent que c’est encore tôt, que leur réflexion en matière d’IA n’est pas aboutie ».
Faire rimer IA avec frugalité, durabilité (et prix plus élevé)
Cette tendance justifierait de se procurer une flotte de PC Copilot+ dès maintenant. Microsoft dirait de préférence un appareil de la gamme Surface. La firme de Redmond met ainsi en avant le 2 en 1 Surface Pro 12 pouces (à partir de 979 euros) ainsi que le Surface Laptop 13 pouces (à partir de 1099 euros). Les deux machines lancées récemment sont propulsées par un SoC Snapdragon X Plus huit cœurs, couplés à 16 Go de mémoire vive et 256 à 512 Go d’espace de stockage. Et Microsoft d’insister sur le NPU Hexagon intégré au SoC de Qualcomm, capable de réaliser jusqu’à 45 TOPS (millier de milliards d’opérations par seconde). C’est cette puce qui est sollicitée par Windows AI Foundry (et par extension Dev Gallery) pour exécuter les LLM et les SLM locaux. « Nous sommes passés de 12 TOPS sur la première génération de nos PC IA en 2022 à 45 TOPS, ce qui est suffisant pour exécuter des algorithmes et de petits modèles de langage », considère Anne Toll.
Ces ordinateurs nomades propulsés par des puces Qualcomm ne sont toutefois pas pour toutes les entreprises et tous les employés. Doués d’une plus grande autonomie que les PC Intel, leur format les destine aux collaborateurs les plus nomades. Les PC équipés de puces Intel sont plus adaptés aux entreprises devant gérer la compatibilité avec des centaines, voire des milliers, de logiciels, reconnaissent les porte-parole de Microsoft France.
En outre, Microsoft s’engage à une certaine sobriété. Cela pourrait aussi être une limitation volontaire de l’usage de capacités locales. L’activité IA en cloud demeure une priorité. Dans un même temps, le géant du cloud doit s’assurer avec ses partenaires que les modèles d’IA tiendront sur un NPU doté au maximum de 48 TOPS (avec les Surface Laptop équipés d’un CPU Intel Core Ultra 7 266v et 268v) quand un GPU dédié d’entrée de gamme comme la RTX 5060 de 8 Go de VRAM affiche 648 TOPS.
La réponse actuelle de Microsoft consiste en la compression de SLM tiers et des siens à travers le volet Foundry Local de Windows AI Foundry. Pour ses propres besoins, le géant mise sur Phi-Silica, un petit modèle de langage de 3,3 milliards de paramètres entraîné et quantisé spécifiquement pour les PC Copilot+. C’est d’ailleurs un composant poussé dans les mises à jour de Windows 11 24H2.
Canalys semble donner raison à Microsoft. En janvier 2025, cette filiale d’Omdia [propriété d’Informa TechTarget, également propriétaire du MagIT] a prédit que les PC IA représenteraient 35 % du volume total de machines expédiées en 2025. Au vu de la généralisation des technologies d’IA, cette portion pourrait atteindre 70 % en 2028, dont la majorité serait des ordinateurs portables. Et comme Microsoft, Canalys anticipe une hausse des prix des équipements.
« À court terme, Canalys s’attend à une prime de prix de 10 % à 15 % sur les PC compatibles avec l’IA par rapport à des PC aux spécifications similaires sans intégration de NPU », écrivaient les analystes de Canalys en mars 2024. À cela s’ajoutent les droits de douane qui ont favorisé l’achat de machines avant leur entrée en vigueur, selon un rapport des analystes publié en avril 2025.
En même temps qu’elles envisagent de déployer des formes d’IA générative, les entreprises maintiennent de plus en plus longtemps leur parc de machines. « Auparavant, nos clients renouvelaient les équipements des salariés tous les trois à quatre ans. Aujourd’hui, nous sommes plutôt entre 4 et 5 ans, voire 6 », relate la directrice des équipements Surface chez Microsoft France.
Le groupe prend désormais au sérieux ce maintien à plus long terme des ordinateurs en entreprise. Microsoft s’engage à un support jusqu’à six ans du BIOS et des drivers. « C’est l’engagement que nous n’avions pas pris auparavant : techniquement, le firmware n’était pas mis à jour après cinq ans », avance Anne Toll.
La France, un « pays avancé » sur le sujet de la migration vers Windows 11
Paradoxalement, c’est Microsoft – groupe qui se targue d’œuvrer en faveur de la durabilité – qui a imposé, pour des raisons de sécurité, la migration de Windows 10 vers Windows 11. La firme de Redmond exige un processeur récent et la présence d’une puce TPM 2.0 pour installer son OS le plus récent. De facto, un bon nombre de machines devront se passer de Windows au cours de leur seconde vie ou termineront au recyclage (ils seront détruits afin de récupérer les matières premières).
Il y a bien évidemment un enjeu cyber : si les clients ne paient pas l’extension, les mises à jour de sécurité cesseront à partir du mois d’octobre 2025.
« 14 % [de partenaires de distribution concernant des PME] affirment que leurs clients ne sont pas au courant de la fin de vie de Windows 10 et 21 % que leurs clients sont au courant, mais n’ont pas l’intention de procéder à une mise à niveau. »
Ishan DuttAnalyste principal, Canalys
« Un sondage réalisé en mars par Canalys auprès de partenaires de distribution qui connaissent les plans de renouvellement des PC des PME a révélé que 14 % d’entre eux affirment que leurs clients ne sont pas au courant de la fin de vie de Windows 10 ; et 21 % supplémentaires affirment que leurs clients sont au courant, mais qu’ils n’ont pas l’intention de procéder à une mise à niveau », a déclaré Ishan Dutt, analyste principal chez Canalys en avril 2025. « Pour les clients dans ces situations, le retard dans la planification signifie qu’ils sont susceptibles de faire face à un environnement plus coûteux lorsque le moment est venu de rafraîchir leurs parcs de PC. »
Mais la « France est un pays plutôt bien avancé sur le sujet », dixit Anne Toll. La migration vers Windows 11 se ferait à travers le renouvellement de pc de « manière assez classique ». Les entreprises les plus avancées ont débuté cet effort entre 2022 et 2024. Et, « dès 2024, beaucoup d’entreprises étaient déjà sur la réflexion de rééquiper leur flotte », affirme la responsable. « Certains ont voulu attendre 2025, certains attendent jusqu’au bout [jusqu’au mois d’octobre 2025, N.D.L.R.]. Mais il y en a beaucoup qui le font progressivement ».