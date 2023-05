La thématique de l’IA générative agite les entreprises. Elle rebat les cartes sur le marché des éditeurs d’Intelligence artificielle. Et face aux géants américains, des alternatives émergent, aussi bien du côté de l’open source que de celui des solutions propriétaires.

C’est le cas de l’éditeur français LightOn qui propose, avec son offre Paradigm, une alternative européenne aux services d’OpenAI, de Microsoft et de Google.

LightOn a ainsi mis au point un LLM français « équivalent » à GPT-3, « un peu moins gros, mais avec des capacités similaires », compare Igor Carron. « Nous avons ensuite entraîné d’autres modèles, de plus en plus gros, dont un de 10 milliards de paramètres. Et nous avons commencé en 2022 à le vendre au travers d’une API », continue-t-il.

« Chez LightOn, ce que nous proposons aux entreprises avec Paradigm c’est de gérer leurs propres flux de données et de les réutiliser pour réentraîner et améliorer leurs modèles ». Autrement dit des LLM hébergés en France ou en Europe, administrés dans l’infrastructure des utilisateurs, qui leur permettent de valoriser leurs données, tout en gardant la main sur celles-ci.

Dans l’IA générative – peut-être encore plus que dans d’autres formes d’IA –, les données ont une valeur importante et doivent être protégées, insiste Igor Carron. La preuve ? Des acteurs comme Twitter et Reddit limitent à présent l’accès à leur API pour mieux contrôler l’exploitation qui est faite de leurs patrimoines à des fins d’entraînement des IA tierces.

« Vous pouvez exécuter ce type de modèle sur une infrastructure plus réduite de manière à l’utiliser sans générer une facture exorbitante » vante le co-CEO. Et en l’exécutant sur une infrastructure locale (derrière les murs de l’entreprise ou sur un cloud privé par exemple), les entreprises peuvent alimenter « leurs » LLMs avec leurs propres données.

Des LLMs sur mesure pour chaque entreprise

Depuis le buzz ChatGPT, ce discours et l’acculturation du marché sont plus simples à transmettre, apprécie le cofondateur. Mais dans le même temps, cette démocratisation s’est traduite par des débats d’experts. De grandes figures comme Yann LeCun (de Meta) ou Luc Julia (désormais chez Renault) estiment par exemple que l’IA générative est limitée ou qu’elle n’a rien d’une révolution.

Igor Carron ne souhaite pas rentrer dans ces débats. « Avant décembre 2022, il était compliqué d’expliquer les LLM. Depuis ChatGPT, on est un peu “has been” si on ignore de quoi il s’agit. La question n’est donc pas de savoir s’il s’agit d’une révolution ou non, [ni] de partager l’opinion de Yann ou de Luc. L’important, c’est que ces technologies soient considérées comme viables et qu’elles commencent à être utilisées », retient-il au contraire.

Et plutôt que de théoriser sur une révolution générale (ou non), le dirigeant préfère évoquer la valeur créée par des LLM centrés et adaptés aux besoins particuliers des entreprises utilisatrices. « Une partie de l’entreprise résidera véritablement dans le LLM, construit et personnalisé sur son propre savoir-faire », martèle-t-il. « Localement, pour chaque entreprise, je pense qu’il sera important de disposer de son LLM et de son infrastructure ».

« Nous commençons à entrer dans un nouveau modèle. J’observe un début de prise de conscience de la possibilité, au-delà des data lakes, d’utiliser correctement les données non structurées (…) Dans le futur, une majorité des entreprises seront donc “LLM based”. Elles pourront réellement tirer profit de ces outils pour générer de la valeur en interne à partir de leurs données. », entrevoit-il.

Mais avec sa vingtaine de salariés, LightOn a-t-il véritablement la capacité d’être une alternative crédible aux géants mondiaux avec leurs milliards de dollars d’investissement ?

Igor Carron refuse tout défaitisme. « De petites équipes peuvent faire la différence. », lance-t-il sans complexe. Et « non », continue-t-il, l’Europe n’est pas dépassée… Sauf sur les capacités en matière de GPU.