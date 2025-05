Le fournisseur de modèles d’IA Anthropic a présenté le 22 mai Claude Opus 4 et Claude Sonnet 4.

Cette annonce intervient alors que les concurrents d’Anthropic, notamment OpenAI, Mistral, Google et Meta, ont récemment dévoilé une série de nouveaux LLM.

De fait, le rythme de développement de ces produits « non déterministes » n’a pas ralenti. Et ce, plus de deux ans après le lancement par OpenAI de GPT-3.5 et de son application ChatGPT.

Programmation, raisonnement, agents IA : les atouts de Claude 4, selon Anthropic Claude Opus 4 et Sonnet 4 sont des modèles de vision-langage hybrides qui peuvent fournir des réponses dites « raisonnées » ou instantanées. Ils sont dotés d’une fenêtre de contexte de 200 000 tokens. Opus 4 peut générer jusqu’à 32 000 tokens. Sonnet 4 peut en produire le double. La date limite des données d’entraînement (majoritairement issu du Web) est mars 2025 pour Opus 4 et octobre 2024 pour Sonnet 4. Depuis l’application Claude.ai, les modèles sont accessibles à tous les abonnés payants, et les abonnés gratuits peuvent accéder à Claude Sonnet 4. Les deux modèles Claude 4 sont disponibles sur l’API d’Anthropic, Amazon Bedrock et Vertex AI de Google. Opus 4 est facturé 15 dollars en entrée pour 1 million de tokens et 75 dollars pour un million de tokens en sortie. Sonnet 4 coûte 3 dollars pour 1 million de tokens en entrée, et 15 dollars en sortie. Pas de changement par rapport à Claude 3.7, mais la tarification est plus élevée en moyenne que celles des concurrents. La nouvelle génération de modèles d’Anthropic arrive plus d’un an après que le fournisseur a lancé la génération précédente de Claude et trois mois après avoir lancé Claude 3.7 Sonnet et Claude Code. Pour rappel, les utilisateurs ont remarqué que les performances de Claude 3.7 Sonnet étaient parfois moins bonnes que celles de son prédécesseur de la famille Claude 3.5. Claude Opus 4 est un modèle dédié à la programmation qui peut maintenir ses performances sur des tâches complexes et de longue durée. Il peut également exécuter des flux de travail propulsant les agents IA. Lors du test d’Opus 4, le modèle a démontré qu’il était capable d’effectuer environ sept heures de travail de programmation en autonomie, selon Anthropic. Claude Sonnet 4 remplace Claude 3.7 Sonnet et inclut, lui aussi, des capacités de programmation et de raisonnement. « Ce que nous essayons de faire avec ces modèles, c’est de continuer à repousser les limites », vante Alex Albert, responsable des relations avec les développeurs chez Anthropic. « Avec Claude 4, et avec Opus 4 en particulier, nous voulons établir de nouvelles normes pour la programmation, pour le raisonnement avancé en général et pour les agents IA ». Au-delà des modèles, Anthropic a dévoilé de nouvelles capacités. La réflexion étendue avec utilisation d’outils permet désormais aux deux modèles d’effectuer des recherches Web tout en menant une analyse approfondie. Aussi, les modèles ne présentent plus forcément le processus de réflexion complet de Claude, mais proposent des synthèses de leur raisonnement. Ces résumés sont rarement effectués, selon l’éditeur. « D’après notre expérience, seulement 5 % des processus de pensée sont suffisamment longs pour déclencher ce résumé », expliquent les chercheurs d’Anthropic. « […] Les développeurs qui souhaitent que les processus de pensée soient affichés dans leur intégralité sans être résumés peuvent opter pour un mode développeur ». Le fournisseur a également lancé quatre nouvelles fonctionnalités sur l’API Anthropic en direction des développeurs. Sans surprise, Claude 4 prend en charge le protocole open source MCP (Model Context Protocol). En sus d’un outil d’exécution de code, Anthropic a présenté l’API « Files » qui permet de télécharger des fichiers et les soumettre à ses LLM « sans les retélécharger » et un moyen de mettre en cache les instructions pendant une heure.