Moment Labs : « AWS est autant un facilitateur de business qu’un fournisseur d’IT »

La startup française appuie le succès international de sa solution d’indexation des contenus vidéo sur l’infrastructure d’AWS. Au départ, parce que son offre correspondait mieux à l’approche développeurs. Aujourd’hui, parce qu’il lui ouvre les portes du marché américain.

Rester chez AWS parce qu’il n’y a plus vraiment d’intérêt d’aller ailleurs. Moments Labs est l’une de ces startups high-tech nées dans le cloud. Son activité – un logiciel MXT-2 basé sur une IA qui identifie, indexe et sert à retrouver chaque contenu dans une vidéo – repose sur des ressources informatiques de pointe. Mais elle n’a jamais eu de serveurs en propre.

« Certains de nos clients adorent les processeurs graphiques et aiment bien avoir ça chez eux. Mais combien cela coûte-t-il en maintenance, en déplacements, en migration par rapport au fait de rester chez un fournisseur de cloud public qui va déployer de nouvelles gammes d’instances dans deux mois ? », lance Frédéric Petitpont, le directeur technique et co-fondateur de Moment Labs (en photo en haut de cet article).

« Une startup a des impératifs de croissance qui sont très forts. Dans notre secteur d’activité, il y a 500 heures de vidéo qui sont publiées toutes les minutes sur YouTube. Notre ambition est donc que notre produit puisse fonctionner à cette vitesse-là. Dans ce contexte, nous n’avons même pas essayé de créer nous-mêmes notre datacenter », ajoute-t-il.

Une solution basée sur des IA, qui pourrait fonctionner ailleurs que chez AWS

Moments Labs est née il y a sept ans avec la promesse faite à des acteurs des médias, notamment la chaîne de télé LCI ou l’agence AFP, de taguer chaque instant de leurs contenus vidéo, afin d’en retrouver facilement des extraits pour illustrer d’autres sujets. À l’époque, l’IA générative n’existait pas encore, mais Moments Labs avait réussi à trouver sur le marché des petits moteurs de transcription de la bande audio et de reconnaissance de motifs visuels qu’il assemblait autour d’une base de données vectorielle.

Une base de données vectorielle range les informations par coordonnées, un peu comme un tableau Excel, mais avec davantage de dimensions. Dans le principe, cela favorise des « régions » de mots-clés qui permettent à un moteur de recherche de trouver des réponses pertinentes, même si l’utilisateur n’a pas utilisé le mot-clé exact dans sa recherche.   

Outre trouver des serveurs pour exécuter ces moteurs, Moments Labs a eu dès le départ besoin d’une grande capacité de stockage pour héberger les vidéos de ses clients le temps de leur traitement.

« Nous avions comparé toutes les offres de calcul et de stockage en cloud disponibles. Elles se valent à peu près toutes en matière de performances et de prix. Mais nous avons choisi AWS, car il était celui qui offrait la meilleure expérience pour les développeurs : vous tapez votre ligne de code et le travail se lance, vous n’avez pas besoin d’administrer à côté le déploiement des ressources », se souvient Frédéric Petitpont.

Le succès est rapidement au rendez-vous et l’offre technique de Moment Labs grandit au même rythme. Les moteurs de transcription achetés sur étagère sont petit à petit remplacés par des VLM maison (moteurs de langage de vision, de véritables IA), codéveloppés avec les chercheurs de l’Institut Mines-Télécom (IMT). Ceux-ci sont bien plus fonctionnels et aussi plus efficaces pour économiser les ressources de calcul, ce qui fait automatiquement baisser le coût de fonctionnement.

Le logiciel de recherche dans la base de données vectorielle s’appuie quant à lui sur de véritables LLM au fur et à mesure que ceux-ci arrivent sur le marché. Leur avantage est qu’il permet aux utilisateurs d’écrire des prompts plus précis qu’une recherche par mots-clés. Frédéric Petitpont explique utiliser principalement ceux de Meta (Llama) et de Mistral.

Jusque-là, aucun de ces éléments n’est nécessairement fourni par AWS. L’hyperscaler fournit juste des ressources pour les faire fonctionner.

Mais une dépendance de fait à AWS

Dans le principe, Moments Labs n’exécute sur les ressources qu’il loue chez AWS que deux choses. D’abord, l’indexation des vidéos sources, lesquelles sont momentanément sur le S3 qu’il loue à AWS. Ensuite, le moteur de recherche qui pointe vers des vidéos qui ont été indexées, mais celles-ci sont cette fois-ci stockées sur les ressources du client. Le logiciel de recherche de Moments Labs peut se connecter à tous types de stockage, qu’il s’agisse de services en ligne chez un concurrent d’AWS, comme de NAS installés sur un site. Pour des raisons de bande passante, Moments Labs recommande tout de même l’utilisation d’un stockage S3 chez AWS.

Ce fonctionnement serait identique chez n’importe quel autre cloud. Mais petit à petit, Moments Labs est devenu un expert des outils qu’AWS met à sa disposition pour orchestrer ce fonctionnement. En particulier, il minimise l’utilisation de machines virtuelles et privilégie l’exécution par à-coups de ses codes sur des instances dites serverless. Cela lui reviendrait bien moins cher à la fin du mois. Et, ce, que ce soit pour ses propres codes (services AWS Lambda et Fargate), comme pour les VLM (AWS Sagemaker), comme pour les LLM (AWS Bedrock).

« Avec ces services, tout est automatisé, principalement l’élasticité ; quand on est une startup, il faut que nous passions le moins de temps possible sur ces choses-là. Et puis, les serverless nous évitent de payer en permanence l’hébergement de modèles de 70 milliards de paramètres, ce qui nous coûterait très cher », dit Frédéric Petitpont.

« Aller sur un autre cloud nous coûterait des coûts de migration. Il faudrait aussi avoir des DevOps qui connaissent plusieurs clouds, et un service support suffisamment formé. »
Frédéric PetitpontDirecteur technique et co-fondateur, Moment Labs

Il reconnaît que cela a installé une certaine dépendance.

« Bien sûr, au départ, nous souhaitions être agnostiques vis-à-vis du fournisseur de cloud, en n’utilisant que des technologies génériques. Mais bon, pour notre moteur d’orchestration interne, par exemple, qui repose sur le générique Apache Kafka, nous avons tout de même pris la version serverless MSK d’AWS, parce qu’elle est entièrement gérée par AWS. Oui, cela nous demande d’utiliser quelques API particulières, mais c’est un problème mineur au regard du temps d’administration que cela nous fait gagner », détaille-t-il.

Et de considérer que faire héberger sa solution ailleurs que chez AWS ne l’intéresse de toute façon pas plus que cela, vu les contraintes auxquelles il s’exposerait. « Aller sur un autre cloud nous coûterait des coûts de migration. Il faudrait aussi avoir des DevOps qui connaissent plusieurs clouds, et un service support suffisamment formé pour savoir que tel code d’erreur a telle signification chez GCP et telle autre chez AWS. Finalement, cela ferait monter le coût de l’infrastructure. »

« Ils [AWS] nous mettent en relation avec d’autres clients à eux, car, forcément, plus nous aurons d’activité, plus nous consommerons de services. »
Frédéric PetitpontDirecteur technique et co-fondateur, Moment Labs

Et puis, il n’y a pas que la technique. « Quand AWS nous dit “nous vous aidons à augmenter votre activité”, ce n’est pas seulement du point de vue de la fourniture en logiciels et en matériel. Il s’agit aussi des actions de vente. Ils nous mettent en relation avec d’autres clients à eux, car, forcément, plus nous aurons d’activité, plus nous consommerons de services. Or, en matière de clients, AWS a une position de fournisseur leader sur le marché que j’appelle Media & Entertainment, c’est-à-dire notre cible. »

« Enfin, nous sommes une startup française, notre équipe est basée en France. Nous avons un super produit, mais il n’a pas été créé dans la Silicon Valley. Travailler avec AWS nous a ouvert les portes du marché américain. Or, en cette fin d’année, les revenus qui viennent de ce marché-là ont dépassé 50 % de notre chiffre d’affaires », conclut-il.

Pour approfondir sur IaaS