fizkes - stock.adobe.com
Speech to text : OVHcloud veut acquérir le Français Gladia
La maison mère d’OVHcloud cherche à acquérir Gladia, un spécialiste de l’IA appliquée à la transcription vocale. Les dirigeants des deux sociétés se connaissent bien : la startup a été cofondée par un ancien d’OVHcloud.
OVH Groupe, maison mère d’OVHcloud, a annoncé le 11 juin être entré en « négociations exclusives » pour le rachat de Gladia. Le montant de l’acquisition n’a pas été évoqué.
Gladia, expert du speech to text (de la voix vers le texte), a été fondé entre Paris et Cesson-Sévigné (près de Rennes) en 2022 par Jonathan Soto et Jean-Louis Quéguiner, ancien vice-président de la recherche et de l’innovation chez OVHcloud. La société installée entre Paris et New York revendique 2000 clients et plus de 300 000 utilisateurs, principalement des développeurs. Le chiffre d’affaires de la société n’a pas été dévoilé. Il y a un an, Jean-Louis Quéguiner expliquait que 80 % des revenus de la société et 50 % de ses clients provenaient d’Amérique du Nord.
En 2024, Gladia avait levé 16 millions de dollars en séries A auprès d’investisseurs français et américains. Au total, elle a levé environ 20,3 millions de dollars.
Ses services sont utilisés par la plateforme IA vidéo Heygen, par Livestorm, une plateforme de webinaire, TechCrunch, Recall, ou encore l’assureur Alan.
Gladia, un des leaders technologiques de son secteur
La plateforme de transcription en lot et en streaming est hébergée entre OVHcloud et AWS ; elle est en compétition avec AssemblyAI, Speechmatics, Deepgram, ElevenLabs, les services équivalents des fournisseurs cloud et dans une certaine mesure Mistral AI.
Gladia entraîne ses propres modèles de transcription. Elle vient de présenter, le 10 juin 2026, Solaria-3. Le modèle speech to text a été entraîné à partir d’enregistrements ou de flux captés dans des environnements bruyants auprès d’individus qui ne parlent pas dans leur langue d’origine et avec un accent. La majeure partie des clients de Gladia sont des centres de contact et des équipes commerciales qui synchronisent les transcripts avec leur CRM.
Solaria-3 est spécialisé dans cinq langues : l’anglais, le français, l’allemand, l’espagnol et l’italien. Solaria-1 couvre plus de 100 langages. Avec Solaria-3, Gladia dit afficher le taux d’erreur par mot le plus faible du marché sur l’anglais. Et la startup de présenter des parangonnages en provenance d’exemples réels. Selon Artificial Analysis, le nouveau modèle se place à 0,1 point de pourcentage derrière Universal 3 Pro d’AssemblyAI (WER à 3,2 % contre 3,1 %). Les deux modèles seraient derrière Voxtral Small de Mistral AI (2,8 %), MAI Transcribe 1.5 de Microsoft (2,6 %) et Scribe V2 d’ElevenLabs (2,2 %). Ces parangonnages sont évidemment à éprouver en situation réelle.
Alimenter le laboratoire d’IA souveraine d’OVHcloud
Même si ce marché de niche est déjà saturé, Gladia n’a pas à rougir face à ses compétiteurs. C’est aussi pour cela que le groupe OVH entend intégrer l’équipe de chercheurs de la startup dans son Lab AI, avec les chercheurs de la société Dragon LLM, rachetée en mars 2026. Il s’agira également « d’internaliser les briques speech to text » de Gladia pour les proposer sur OVHcloud.
Si ce rachat est concluant, il participera à l’ambition du fournisseur cloud de « développer les prochaines générations de technologies d’IA générative, agentique et multimodale souveraines ». Dans ce cas-là, OVHcloud pourra proposer une alternative pertinente à Microsoft, ElevenLabs et AssemblyAI. Le sujet du transfert de données vocales et textuelles vers des serveurs outre-Atlantique n’en sera plus un.
