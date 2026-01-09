Les acteurs du marché sont d’accord. Pour que l’IA générative gagne en pertinence, il est nécessaire de spécialiser les modèles de langage dans des domaines (des verticaux), et, idéalement, de les entraîner sur les données des organisations elle-même. Une autre tendance, due à la fois à la pénurie de composants et une nécessaire frugalité pour des raisons économiques (et écologiques ?), consiste en la mise à disposition de petits modèles de langage (Small Language Model ou SLM). Ceux-là doivent être calibrés pour s’exécuter sur des GPU de faible puissance ou sur des CPU.

Ce sont les deux créneaux de prédilection de Dragon LLM. Cette société française créée dans les Yvelines se nommait auparavant Lingua Custodia. Elle a été fondée en 2011. « Nous venons de l’univers du NLP (traitement du langage naturel) et de la traduction automatique pour le vertical financier », indique Olivier Debeugny, fondateur et CEO de Dragon LLM. LeMagIT a pu le rencontrer lors du salon Adopt AI, le 26 novembre dernier.

Au fil des ans, celle qui est récemment devenue Dragon LLM a entraîné des « milliers » de modèles NLP consacrés à la traduction de documents financiers. Elle a développé une plateforme SaaS hébergée sur des serveurs dédiés chez Scaleway. Elle est utilisée par des entités de certaines banques, dont BNP Paribas, Crédit Agricole, Crédit Mutuel, Natixis ou encore HSBC. Actuellement, Dragon LLM met à disposition plus de 200 modèles suivant la typologie des documents. Dernièrement, cette plateforme a intégré un système RAG. « C’est très utile pour répondre à des appels d’offres, faire du contrôle de cohérence entre des documents marketing et juridiques », illustre Olivier Debeugny.

NLP et finance, les deux expertises de Dragon LLM Développer une telle plateforme n’était pas la volonté du dirigeant. La société s’est adaptée à la demande des clients. « Ce que je voulais faire il y a dix ans, c’était de vendre des modèles directement. Notre ADN, c’est de récupérer des données, de les traiter, d’entraîner un modèle et de les évaluer », souligne-t-il. L’équipe de recherche de Dragon LLM publierait « trois à cinq articles » scientifiques par an. « Par exemple, cette année [en 2025, N.D.L.R], nous avons publié un papier sur le contrôle des hallucinations dans les systèmes RAG avec les équipes R&D de BNP Paribas », relate Olivier Debeugny. Alors, quand ChatGPT a débarqué, le CEO n’a pas vu l’opportunité de créer une interface pour exploiter les modèles de langage, il l’en avait déjà mis une en place. Enfin, il pouvait appliquer son plan de départ : entraîner des modèles spécialisés. « Nous, nous croyons à la notion de frugalité. Il n’est pas nécessaire d’avoir des modèles énormes pour traiter des cas d’usage très restrictifs », assure-t-il. « Du même qu’au départ nous entraînions des modèles pour traduire uniquement des prospectus financiers, de grandes banques viennent désormais nous voir pour traiter des cas d’usage très spécifiques – l’analyse de messages SWIFT, le suivi d’emprunts, etc. – qu’elles veulent exécuter sur un CPU ». Cela passe évidemment par une analyse de faisabilité, fonction du cas d’usage, des performances attendues, des contraintes d’infrastructure et de la vitesse de réponse souhaitée. « Nous suivons régulièrement l’état de l’art », affirme Olivier Debeugny. « Parfois, ce n’est pas encore possible de traiter certains cas d’usage, mais dans d’autres ça l’est, et dans ces situations-là, nous pouvons faire du fine-tuning à la demande ».

Un partenariat avec L’Agefi pour entraîner des LLM dédiés à la finance Pour ce faire, il faut des briques de bases. Les modèles open weight ne manquent pas. Un petit tour sur la plateforme Hugging Face suffit pour s’en rendre compte. Or, peu d’entre eux sont dédiés à la finance. En collaboration avec L’Agefi, Dragon LLM a été sélectionnée dans le cadre d’un appel d’offres France 2030 pour entraîner des modèles spécialisés. Au début du mois de novembre, Dragon LLM a publié deux collections de modèles open weight : LLM Open Finance et LLM Pro Finance. Elles contiennent cinq modèles dotés de 8, 12, 33, et 71 milliards de paramètres et leurs variantes encodés en FP8. Ils sont entraînés sur la base des LLM Llama 3.1 de Meta (ex-Facebook), Qwen 3 d’Alibaba et Gemma 3 de Google DeepMind. « Nous les avons fine-tuné pour le langage et différentes tâches du monde financier –, classification de documents, analyses de sentiments, traduction, etc. », indique Olivier Debeugny. Selon le dirigeant, le gros du travail a consisté à sélectionner les bonnes données. « Plus de la moitié (54,4 %) de l’ensemble des données est constituée de contenu financier, notamment des analyses de marché, des documents réglementaires, des données comptables et des discussions financières synthétiques », peut-on lire dans la documentation. « Cela garantit une solide expertise dans les domaines de la banque, de l’investissement et du raisonnement économique ». Résultat, les plus petits modèles font mieux qu’un LLM concurrent libéré par Salesforce. Et leur performance peut être affinée en fonction des besoins des entreprises, répète Olivier Debeugny. Le choix de trois modèles de trois fournisseurs différents révèle l’intérêt des data scientists et des ingénieurs de DragonLLM pour les architectures de modèles. « En parallèle du projet avec L’Agefi financé par Bpifrance, nous avons gagné un concours de la Commission européenne en 2024. Nous avons pu accéder aux supercalculateurs Leonardo en Italie, et Jupiter en Allemagne avant même qu’il soit en production », indique le dirigeant. Les projets des quatre sociétés lauréates (Tilde, Textgain, Lingua Custodia, Unlabel) ont été sélectionnés parmi 94 propositions. Ils ont partagé 1 million d’euros et ont bénéficié de 8 millions d’heures de calcul sur les supercalculateurs Lumi, Leonardo et Jupiter. « Les autres sociétés ont été choisies pour des sujets liés aux données et à la langue. Nous, nous avons attaqué ce sujet sur l’angle de l’architecture », relate Olivier Debeugny.