Un grand modèle de langage pensé pour l’Europe. EuroLLM-9B est un modèle multilingue qui couvre les vingt-quatre langues officielles de l’Union européenne, mais aussi onze autres langues comme le galicien, le catalan, le chinois, le coréen (un des soutiens du projet est un grand groupe sud-coréen), le japonais, le hindi, le norvégien ou encore le turc.

Open source et open-weight

Ce LLM est le fruit de la collaboration de plusieurs organisations privées et publiques, dont des institutions académiques comme CentraleSupélec, l’Université d’Édimbourg ou Sorbonne Université.

Pour Pierre Colombo, du MICS (le laboratoire de recherche en mathématique et en sciences informatiques de CentraleSupélec) et fondateur d’une LegalTech (Equall), « ce modèle, entièrement open source et “open-weight”, vient répondre aux besoins des langues européennes et rivalise avec les approches internationales les plus performantes ».

Pour mémoire, « open-weight » désigne des modèles où les « poids » (weights) d’un modèle pré-entraîné sont publiquement accessibles.

Le LLM-9B est disponible en accès libre sur Hugging Face (pré-entraîné et post-entraîné).