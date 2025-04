OVHcloud sort officiellement un portefeuille de services d’intelligence artificielle générative : AI Endpoints, une solution cloud serverless pour intégrer ces modèles dans des applications métiers.

La plateforme propose à son lancement une quarantaine de modèles parmi les plus populaires de l’écosystème open source et open weight : Llama 3.3 70B, Mixtral 8x7B, Mistral Nemo et Llama 3.1 8B (deux Small Model Languages), Codestral Mamba, Qwen 2.5 Coder 32B (générateurs de code), Qwen 2.5 VL 72B, ou encore Stable Diffusion XL (pour la génération d’images).

On y retrouve également des modèles spécialisés dans la transcription (ASR), la synthèse vocale (TTS) ou le raisonnement (DeepSeek-R1). La liste est non exhaustive et sera amenée à évoluer. Il est également possible de se connecter à OpenAI via l’API de ce dernier.

Pour OVHcloud, cette approche reste cependant une alternative souveraine aux grands éditeurs américains. Fidèle à sa stratégie « souveraine », OVHcloud héberge AI Endpoints dans ses centres de données, en particulier celui de Gravelines, en France.

Faciliter le déploiement des modèles open-weight L’objectif est également de rendre les modèles open weight immédiatement exploitables, en particulier dans des environnements de production. Le service permet, par exemple, d’alimenter des chatbots, des assistants vocaux, des outils de transcription automatique, des agents de codage ou encore des applications analytiques – illustre OVH. En beta depuis plusieurs mois, le service est officiellement disponible cette semaine. « AI Endpoints permet aux développeurs d’intégrer facilement les modèles […] en toute confiance dans l’infrastructure souveraine d’OVHcloud », résume Yaniv Fdida, chief product and technology officer du Nordiste. La tarification repose sur le nombre de jetons consommés par minute et par modèle, dans une logique de « pay-as-you-go ». Avant un déploiement, les utilisateurs peuvent expérimenter les fonctions d’IA dans une sandbox pour tester les performances et la pertinence des modèles sélectionnés.