Cette capacité est valable pour deux produits : Azure Local – ex-Azure Stack HCI – et pour Microsoft 365 Local. En clair, les clients peuvent avoir la maîtrise du contrôle plane sur une « appliance VM » (un cluster dédié), sans nécessiter de connexion au cloud Azure. C’est le mode « déconnecté ».

Microsoft 365 Local, mais avec Skype Business au lieu de Teams Azure Local semble avant tout là pour gérer les instances Microsoft 365 contenant des serveurs Exchange, SharePoint et Skype for Business. Exchange est le socle pour stocker les mails d’Outlook, SharePoint est le système GED de Microsoft, tandis que Skype Enterprise Server est la pile VoIP/MMR pour gérer les appels, les réunions, les messages et messages vocaux de Skype for Business. Contrairement à une idée répandue, l’ancêtre de Teams n’est pas mort. Il existe dans une déclinaison « SE », une version légèrement diminuée de Skype For Business 2019. Et 365 Local est pris en charge « au moins jusqu’en 2035 ». Microsoft avait d’abord présenté Azure Local comme un moyen de migrer des charges de travail VMware vers ses propres services. C’est toujours possible. Ce mode déconnecté prend également en charge les applications conteneurisées. Quoi qu’il en soit, pour déployer cette pile technologique, il faut passer par les partenaires de Microsoft « Azure Local Premier ». Ils sont au nombre impressionnant de deux : Lenovo et HPE. Ils proposent une souscription pour louer les serveurs au lieu de les acheter (Lenovo TruScale, HPE GreenLake). Et la firme de Redmond de proposer, pour Microsoft 365 Local, une « architecture de référence à grande échelle » composée de trois serveurs Azure Local à trois nœuds pour SharePoint Server et SQL Server, quatre serveurs à nœud unique pour les boîtes aux lettres Exchange Server et deux serveurs single node pour le transport des mails. Sans oublier le serveur pour le control plane.

Foundry Local, pour internaliser l’inférence IA Une troisième offre n’est pas encore disponibilité générale : Foundry Local. Là, il s’agit de permettre aux entreprises de déployer des capacités d’inférence dans leur data center, « en partenariat avec Nvidia ». Une fonctionnalité qui nécessite de déployer Windows Server 2025. Les modèles d’IA (principalement open weight) peuvent être téléchargés depuis le catalogue Azure Foundry ou depuis Hugging Face, puis le compilateur ONNX, Olive. Les serveurs proposés par HPE et Lenovo prennent en charge les GPU pour data center L4, L40, L40s (A2 pour Lenovo et A16 pour HPE). La prise en charge des RTX 6000 Blackwell Server Edition est en disponibilité générale. Les serveurs compatibles – Dell AX-770, Lenovo ThinkAgile MX650a V4, et HPE ProLiant DL380 Gen 12 – ne sont pas listés dans le catalogue de partenaires de Microsoft. Toutefois, Foundry Local s’appuie sur la même architecture que sur Windows AI Foundry. Bien qu’un GPU ou un NPU soit recommandé, il n’est pas nécessaire d’en disposer. La couche de compilation Olive peut optimiser les modèles pour des puces Intel et AMD, avec des performances moindres, certes. Chaque serveur peut accueillir jusqu’à 8 To de mémoire vive DDR5 4800 MHz ou 5600 MHz (encore faut-il les trouver). Du côté d’Azure Local, Microsoft teste le déploiement à très grande échelle, plus de 10 000 vCPU et plus de 100 nœuds. Le cluster dédié pour le control plane d’Azure Local nécessite au minimum 3 nœuds, 96 Go de RAM par nœud, 24 cœurs physiques, 2 To de stockage SSD par nœud et un disque de boot de 960 Go. Un contrat Microsoft Customer Agreement for Enterprises (MCA-E) et une « raison valide » s’impose pour accéder à l’offre. Le géant du cloud semble avoir trouvé preneur chez l’opérateur – ESN Proximus au Luxembourg.