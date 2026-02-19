Douze jours après Claude Opus, Anthropic a « lâché dans la nature » Claude Sonnet 4.6.

Le modèle de langage de « milieu de gamme » dispose du même accès en bêta à une fenêtre de contexte de 1 million de tokens. Par défaut, elle est de 200 000 tokens. Il peut générer jusqu’à 128 000 tokens, contre 64 000 pour Sonnet 4.5. Selon Anthropic, la connaissance du Web de Sonnet 4.6 s’arrête au mois de mai 2025.

Les améliorations sont similaires à son grand frère Opus 4.6 : Anthropic a travaillé sur la programmation, le « computer use » (sur lequel le fournisseur aurait mis l’accent lors de l’entraînement), la planification agentique, l’exécution à long terme, certaines tâches métier et le design.

Là encore, les fonctions de raisonnement adaptatif, de recherche Web, d’utilisation d’outils, et la compression du contexte passé sont disponibles à travers les API badgées Claude Sonnet 4.6.

Meilleur qu’Opus 4.5, très proche d’Opus 4.6 Toutefois, l’écart qui persistait auparavant entre le modèle de milieu et de haut de gamme se réduit. « Claude Sonnet 4.6 égale les performances d’Opus 4.6 sur benchmark OfficeQA qui mesure la capacité d’un modèle à lire des documents (comme des diagrammes, des PDF, des tables), y extraire les bons faits et les interpréter », explique Hanling Tang, directeur technique des réseaux neuronaux chez Databricks, dans le billet de blog diffusé par Anthropic Sur l’intelligence Index d’Artificial Analysis, Claude Sonnet 4.6 se place derrière son grand frère et devant GPT-5.2 Codex. Claude Opus 4.6 vient tout juste de perdre une place au classement face à Gemini 3.1 Pro de Google. Au 19 février, Sonnet 4.6 est donc le troisième meilleur modèle disponible selon le cabinet indépendant. Toutefois, il est le premier sur les tâches agentiques, devant Opus 4.6 et le nouveau fleuron de Google. Selon les tests d’Anthropic, Sonnet 4.6 serait encore meilleur pour utiliser les outils des serveurs MCP et pour certaines tâches de programmation. « Les utilisateurs ont même préféré Sonnet 4.6 à Opus 4.5, notre modèle frontière de novembre, dans 59 % des cas », affirme Anthropic. « Ils ont évalué Sonnet 4.6 comme étant significativement moins enclin à la surenchère et à la “paresse”, et significativement meilleur dans le suivi des instructions », précise le fournisseur. « Ils ont signalé moins de fausses déclarations de réussite, moins d’hallucinations et un suivi plus cohérent des tâches à plusieurs étapes ».