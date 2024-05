Codestral base et Codestral Instruct tous deux dotés de 22 milliards de paramètres sont entraînés sur « divers jeux de données » concernant plus de 80 langages de programmation, dont Python, C, C++, JavaScript, Bash, Fortran, et Swift.

Codestral Instruct est capable de répondre à des questions ou générer de la documentation en anglais. En clair, Mistral AI continue de positionner son offre de modèles en direction des développeurs. La startup aurait d’ailleurs une arme de choix pour les convaincre.

Un modèle légèrement au-dessus de Llama 3-70B et de DeepSeek 33B Codestral serait meilleur que Code Llama 70B, Llama 3-70B et DeepSeek 33B, l’un des LLM « open weight » – les plus performants consacrés à la génération de code – quand il est confronté à des tâches de complétion et de type « fill in the middle » liées au langage Python, PHP, Java, SQL et JavaScript des benchmarks HumanEval, HumanEval FIM et MBPP. Il serait également performant pour accomplir des tâches liées à la production de code Kotlin. « Nous avons utilisé Codestral pour effectuer un test sur notre benchmark Kotlin-HumanEval et nous avons été impressionnés par les résultats », affirme Mikhail Evtikhiev, chercheur chez JetBrains, dans le billet de blog publié par Mistral AI. « Par exemple, dans le cas du taux de réussite pour T=0.2, Codestral a obtenu un score de 73,75, surpassant le score de GPT-4-Turbo (72,05) et le score de GPT-3.5-Turbo (54,66) ». Le modèle serait également meilleur que ses compétiteurs plus gourmands en puissance une fois confrontés au benchmark RepoBench. Mistral AI explique ces performances par la longueur de la fenêtre de contexte de Codestral. Celle-ci atteint 32 000 tokens, contre 4, 8 ou 16 000 tokens pour les modèles mis en compétition. Comme à son habitude, Mistral AI est peu prolixe quant aux méthodes d’entraînement et l’architecture de ce modèle. Selon les informations disponibles sur le dépôt Hugging Face, il présente un nombre de couches et de têtes d’attention similaire au LLM « Sparse Mixture of Experts » Mixtral 8x22B. En revanche, le nom du modèle et l’absence du nombre d’experts dans ce même dossier laissent à penser que Codestral est un modèle « dense », à l’instar de Mistral 7B. Codestral est disponible via une API dédiée. Pour l’instant, l’accès à ce point de terminaison est soumis à une liste d’attente. Son accès sera gratuit pendant deux mois. Le LLM est directement disponible cette fois-ci moyennant paiement depuis « La Plateforme », la suite de services mise à disposition par Mistral AI auprès des développeurs. Codestral peut être testé gratuitement en passant par Le Chat, l’assistant conversationnel de la startup. Le LLM dispose d’intégrations pour les frameworks d’IA générative LlamaIndex et LangChain, en sus des outils Continue.dev et Tabnine via un plugin VScode ou Jetbrains.