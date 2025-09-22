L’une des fonctionnalités clés d’Hugging Face n’est autre qu’Inference Provider. Celle-ci permet de tester et d'utiliser – à travers une API unique – des modèles NLP et d’IA générative sur les instances de différents fournisseurs.

Ici, point de Google Cloud, AWS et Microsoft Azure. Hugging Face s’est, dans ce cas, rapproché d’hébergeurs spécialistes des GPU, de fabricants de puces IA, de néoclouds et de fournisseurs de LLM eux-mêmes. L’on y retrouve, entre autres, Groq, Cohere, Nebius, Fireworks, SambaNova, Cerebras, Together.AI, Replicate et Nscale.

Le 19 septembre, Hugging Face a annoncé l’arrivée de Scaleway comme Inference Provider.

C’est le premier fournisseur de cloud français à rejoindre cette liste. Il ne s’agit pas d’exposer les instances GPU, mais de fournir des LLM as a Service en mode « serverless ». Pour commencer, Scaleway propose neuf LLM « open weight » : gpt-oss 120b, gemma 3-27b it, Llama 3.1-8B, Llama 3.3-70B, Qwen 2.5-Coder-32B, Qwen 3 Coder-30B-A3B, Qwen 3-235-B-A22B, Deepseek R1-Distill-Lllama-70B et BGE-multilingual-gemma 2.