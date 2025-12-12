Rester chez AWS parce qu’il n’y a plus vraiment d’intérêt d’aller ailleurs. Moments Labs est l’une de ces startups high-tech nées dans le cloud. Son activité – un logiciel MXT-2 basé sur une IA qui identifie, indexe et sert à retrouver chaque contenu dans une vidéo – repose sur des ressources informatiques de pointe. Mais elle n’a jamais eu de serveurs en propre.

« Certains de nos clients adorent les processeurs graphiques et aiment bien avoir ça chez eux. Mais combien cela coûte-t-il en maintenance, en déplacements, en migration par rapport au fait de rester chez un fournisseur de cloud public qui va déployer de nouvelles gammes d’instances dans deux mois ? », lance Frédéric Petitpont, le directeur technique et co-fondateur de Moment Labs (en photo en haut de cet article).

« Une startup a des impératifs de croissance qui sont très forts. Dans notre secteur d’activité, il y a 500 heures de vidéo qui sont publiées toutes les minutes sur YouTube. Notre ambition est donc que notre produit puisse fonctionner à cette vitesse-là. Dans ce contexte, nous n’avons même pas essayé de créer nous-mêmes notre datacenter », ajoute-t-il.

Une solution basée sur des IA, qui pourrait fonctionner ailleurs que chez AWS Moments Labs est née il y a sept ans avec la promesse faite à des acteurs des médias, notamment la chaîne de télé LCI ou l’agence AFP, de taguer chaque instant de leurs contenus vidéo, afin d’en retrouver facilement des extraits pour illustrer d’autres sujets. À l’époque, l’IA générative n’existait pas encore, mais Moments Labs avait réussi à trouver sur le marché des petits moteurs de transcription de la bande audio et de reconnaissance de motifs visuels qu’il assemblait autour d’une base de données vectorielle. Une base de données vectorielle range les informations par coordonnées, un peu comme un tableau Excel, mais avec davantage de dimensions. Dans le principe, cela favorise des « régions » de mots-clés qui permettent à un moteur de recherche de trouver des réponses pertinentes, même si l’utilisateur n’a pas utilisé le mot-clé exact dans sa recherche. Outre trouver des serveurs pour exécuter ces moteurs, Moments Labs a eu dès le départ besoin d’une grande capacité de stockage pour héberger les vidéos de ses clients le temps de leur traitement. « Nous avions comparé toutes les offres de calcul et de stockage en cloud disponibles. Elles se valent à peu près toutes en matière de performances et de prix. Mais nous avons choisi AWS, car il était celui qui offrait la meilleure expérience pour les développeurs : vous tapez votre ligne de code et le travail se lance, vous n’avez pas besoin d’administrer à côté le déploiement des ressources », se souvient Frédéric Petitpont. Le succès est rapidement au rendez-vous et l’offre technique de Moment Labs grandit au même rythme. Les moteurs de transcription achetés sur étagère sont petit à petit remplacés par des VLM maison (moteurs de langage de vision, de véritables IA), codéveloppés avec les chercheurs de l’Institut Mines-Télécom (IMT). Ceux-ci sont bien plus fonctionnels et aussi plus efficaces pour économiser les ressources de calcul, ce qui fait automatiquement baisser le coût de fonctionnement. Le logiciel de recherche dans la base de données vectorielle s’appuie quant à lui sur de véritables LLM au fur et à mesure que ceux-ci arrivent sur le marché. Leur avantage est qu’il permet aux utilisateurs d’écrire des prompts plus précis qu’une recherche par mots-clés. Frédéric Petitpont explique utiliser principalement ceux de Meta (Llama) et de Mistral. Jusque-là, aucun de ces éléments n’est nécessairement fourni par AWS. L’hyperscaler fournit juste des ressources pour les faire fonctionner.