LightOn n’a pas la visibilité d’un Mistral ou les moyens d’OpenAI. Pour autant, elle a trouvé un créneau pour se démarquer. Après Orange Business avec qui elle développe une offre d’IA générative souveraine, la startup a attiré l’intérêt d’HPE. Comme les autres équipementiers, dont Nutanix et Fujitsu, le groupe américain cherche à se distinguer des fournisseurs cloud en fournissant des offres de cloud privé ou sur site. Il en va de même dans le domaine de l’IA générative. Ces acteurs entendent ainsi simplifier l’accès à de grands modèles de langage et la constitution de systèmes RAG (Retrieval Augmented Generation) pour des clients qui veulent conserver le contrôle de l’IA et des données dans leurs data centers.

Paradigm sur des serveurs HPE ProLiant De son côté, la startup française propose la plateforme Paradigm. Celle-ci inclut une « usine à prompts », un moyen de déployer un système RAG sur des documents internes, de bâtir des agents conversationnels, de répondre à des tâches de classification, de résumé, de reformulation, de traduction, ou encore d’extraction d’entités nommées. LightOn y intègre son modèle dérivé du LLM Falcon, Alfred 40B, et offre la possibilité d’héberger les LLM « open weight » disponibles sur les plateformes communautaires. Dans le cas présent, LightOn peut installer Paradigm sur les serveurs 2U 2P HPE ProLiant DL380A Gen11 (la génération suivante arrive). Chaque serveur est équipé des processeurs Intel Xeon Scalable de 4e ou 5e génération dotés de 8 à 64 cœurs, jusqu’à 3 To de RAM DDR5 et, dans le cas présent, de deux ou quatre GPU NVIDIA H100 NVL 94 Go PCIe (avec NVLINK). Un modèle comme Alfred sera à l’aise dès la présence de deux de ces GPU. « [En matière de configuration], nous travaillons avec les clients et HPE suivant leurs requêtes (nombre d’utilisateurs, latence attendue, etc.) », indique Laurent Daudet, cofondateur et CEO de LightOn. Une fois déployée, la plateforme Paradigm ne requérait pas l’assistance des équipes techniques pour développer les cas d’usage.