Getty Images

Actualites

LLM gourmands, demande forte et IPO en vue : Anthropic lève 65 milliards de dollars

Anthropic justifie sa levée de fonds par la nécessité d’augmenter ses ressources de calcul fortement sollicités en raison de la popularité de ses modèles d’IA très puissants, mais très gourmands. Claude Opus 4.8 ne changera pas la donne.

par

Gaétan Raoul, LeMagIT

Publié le: 29 mai 2026

Le 28 mai 2026, Anthropic a annoncé un nouveau modèle de langage, Claude Opus 4.8, et une levée de fonds.

L’entreprise a levé 65 milliards de dollars en série H. La collecte menée par Altimeter Capital, Dragoneer, Greenoaks et Sequoia Capital porte la valorisation d’Anthropic à 965 milliards, soit environ 113 milliards de plus qu’OpenAI. La société dirigée par Dario Amodei était valorisée 380 milliards de dollars l’année dernière.

La somme récoltée inclut 15 milliards d’investissements précédemment annoncés par les hyperscalers, dont 5 milliards de dollars de la part d’Amazon.

Anthropic s’impose face à OpenAI

En clair, Anthropic lève 50 nouveaux milliards de dollars. En sus des trois meneurs, vingt-trois fonds d’investissement ont rejoint le tour de table (dont MGX, Lightspeed Venture Partners, Coatue ou encore ICONIQ). Il faut ajouter à cela le concours technique de Micron, Samsung et SK Hynix.

De fait, l’un des objectifs de cette levée de fonds est de financer l’achat de puissance de calcul. « Ce financement nous permettra de répondre à la demande sans précédent que nous connaissons actuellement, de rester à la pointe de la recherche et de faire en sorte que Claude soit présent dans un plus grand nombre d’environnements de travail », affirme Krishna Rao, directeur financier chez Anthropic.

Un double enjeu pèse sur Anthropic : les investisseurs attendent son introduction en bourse d’ici à la fin de l’année et elle doit surtout cumuler des ressources de calcul pour étendre son activité.

« Au cours des dernières semaines, nous avons considérablement augmenté notre capacité de calcul », écrivent les porte-parole d’Anthropic dans le même communiqué de presse. « Nous avons signé des accords avec Amazon pour une nouvelle capacité pouvant atteindre cinq gigawatts, avec Google et Broadcom pour cinq gigawatts de capacité TPU de nouvelle génération, et avec SpaceX pour accéder aux capacités GPU de Colossus 1 et Colossus 2 ».

Les modèles Claude sont accessibles sur AWS, Microsoft Azure et GCP. « AWS reste notre principal fournisseur de cloud et partenaire pour l’entraînement », précise l’entreprise.

Là, Anthropic suit la même stratégie de diversification qu’OpenAI. Mais elle n’a pas prétendu vouloir bâtir des capacités de calcul en propre, contrairement à OpenAI et Mistral AI. OpenAI a fait marche arrière concernant une partie de ses projets d’infrastructure. Lors de son Now Summit le 28 mai 2026, Mistral AI a martelé l’idée que l’Europe devait se doter de son infrastructure souveraine pour l’IA. Les projets de la startup représentent environ 200 mégawatts de puissance au sol, loin de la folie des grandeurs d’OpenAI.

Mais là où Mistral AI vise le milliard de chiffre d’affaires en 2026, Anthropic annonce un « revenue run rate », une projection annualisée de son chiffre d’affaires de 47 milliards de dollars. Ce n’est pas un Annual Revenue Rate (ARR, estimation annuelle des revenus liés à la souscription) ou un véritable CA.

Dans le coin opposé, OpenAI entend réaliser un chiffre d’affaires de 30 milliards de dollars en 2026, selon The Information. Lorsqu’elle a annoncé sa levée de fonds de 122 milliards de dollars, OpenAI affirmait avoir atteint un « revenue run rate » de 25 milliards de dollars. Anthropic a réalisé un chiffre d’affaires d’environ 10 milliards de dollars l’année dernière, contre 13 milliards chez OpenAI. Certains observateurs soupçonnent que ces résultats soient pipés.

Les clients face au défi de la maîtrise de la facture

Toutefois, les indicateurs externes tendent à prouver qu’Anthropic prend de l’envergure auprès des entreprises. À partir de données anonymisées collectées en mars 2026, Datadog expliquait qu’Anthropic a bénéficié de 23 % de croissance en nombre d’appels API en un an. Ses modèles étaient utilisés par près de la moitié des 1000 clients du panel de l’éditeur, devant ceux de Google et derrière ceux d’OpenAI.

Selon l’index mené par l’éditeur de solution de gestion de dépenses Ramp, en matière d’achat de souscription aux modèles, plateformes et outils, Anthropic est passé devant OpenAI. L’étude s’appuie sur les données du mois d’avril 2026 de 50 000 entreprises américaines.

Cette croissance s’explique aussi par le coût plus élevé des modèles Claude. Sans oublier qu’Anthropic modifie les tarifs de ses anciens LLM pour pousser ses clients vers les nouveaux. Rien de surprenant : il s’agit de réallouer la puissance de calcul aux modèles les plus récents. De plus, les familles Claude 4.6 et 4.7 se sont montrées gourmandes en tokens.

Justement. Hier, Anthropic a également annoncé Claude Opus 4.8. La société semble bien avoir besoin de ces nouveaux serveurs. Ce modèle basé sur Opus 4.7 (fenêtre de contexte d’un million de tokens, 128 000 tokens en sortie) serait déjà victime de sa popularité.

« Claude Code, qui utilise Opus 4.8, génère sans cesse des erreurs 500 à mesure que nous entrons dans les heures de pointe aux États-Unis. Il est actuellement 8 h 30 [le 29 mai, 14 h 30 en France, N.D.L.R] et je sens que le système ralentit et que les erreurs se multiplient », témoigne Anthony Maio, ingénieur IA chez la startup Pieces, sur LinkedIn.

Les prix restent inchangés. Claude Opus 4.8 coûte 5 dollars pour un million de tokens en entrée, et 25 dollars pour le même volume en sortie. Le fournisseur met à jour son mode rapide (« fast mode ») qui multiplie la vitesse des réponses par 2,5 au double du prix de la vitesse normale. Le fast mode était toutefois trois fois plus cher auparavant, selon Anthropic.

Un mécanisme permet d’introduire de nouvelles instructions système au milieu d’un flux de travail agentique, sans avoir à reformuler le system prompt. Les refus de réponses sont désormais plus finement documentés, tout comme les incertitudes du LLM. Le niveau d’effort, qui détermine les ressources de calcul alloué au raisonnement, est réglé par défaut sur « high ». Les autres paramètres « cassants » introduits avec les API de la famille 4.7 restent en place.

Le contrôle de l’effort est désormais intégré dans Claude.ai et Claude Cowork, tandis que Claude Code a le droit en préversion de recherche aux « flux de travail dynamiques ».

Dans le détail, un workflow dynamique est un script JavaScript capable « d’orchestrer des sous-agents à l’échelle ». Suivant la tâche à accomplir, le modèle Claude sélectionné appelle des « dizaines à des centaines de sous-agents en parallèle ». Toutes les sous-tâches sont vérifiées par le LLM. Audit de code (performance, sécurité, débogage), modernisation et migration : voilà l’intérêt de ce mécanisme gourmand en tokens, d’après Anthropic.

Le script est déterministe, mais le LLM est en charge des sous-agents et des skills. « Un script de workflow contient la boucle, les branchements et les résultats intermédiaires, de sorte que le contexte de Claude ne contient que la réponse finale », peut-on lire dans la documentation.

Un nouveau niveau d’effort est associé à ce mode dans Claude Code : ultracode.

« Lorsqu’ultracode est activé, c’est Claude qui décide quand une tâche nécessite un workflow. Une seule requête peut donner lieu à plusieurs workflows successifs : un pour analyser le code, un pour effectuer la modification et un autre pour la vérifier. Cela s’applique à toutes les tâches de la session ; chaque requête utilise donc davantage de tokens et prend plus de temps qu’aux niveaux d’efforts inférieurs ».

Les usagers se demandent déjà s’ils ne vont pas brûler leur budget de tokens en un seul tour au vu des promesses du fournisseur.

Claude Opus 4.8 : plus pertinent pour les usages agentiques, mais peu efficient

Revenons à Claude Opus 4.8. D’après le cabinet Artificial Analysis, il se hisse à la tête de son Intelligence Index, devant GPT-5.5 (Gemini 3.1 Pro est troisième). Seulement 1,2 point de pourcentage sépare les deux LLM. Opus 4.8 se distingue sur les tâches agentiques liées à la programmation et à la création de fichiers professionnels. Il gratte de peu la première place sur les tests de raisonnement scientifique.

Anthropic affirme avoir mis l’accent sur une meilleure gestion des formes de contexte long, en les compressant moins et en gérant mieux la restauration de son contenu. De même, Opus 4.8 oublierait moins souvent d’utiliser les skills qu’on lui demande d’exploiter.

En revanche, il n’y a pas de véritable amélioration sur la consommation de tokens. « Nous avons constaté qu’Opus 4.8 utilise moins de tours et génère moins de tokens en sortie sur GDPval-AA [un test pour évaluer les performances des LLM sur des tâches a valeur ajoutée dans 44 professions, N.D.L.R], mais il produit à peu près le même nombre de tokens pour compléter l’Intelligence Index tout en affichant des performances nettement supérieures », affirment les analystes d’Artificial Analysis. Il faut noter que le cabinet est désormais très proche des fournisseurs de LLM et devient de plus en plus un sous-traitant pour OpenAI, Google et Anthropic.

Claude Opus 4.7 et 4.8 génèrent environ 110 millions de tokens en sortie, en excluant ceux consacrés au raisonnement. De son côté, Anthropic affirme que le nouveau LLM « gaspille moins de tokens de raisonnement pour le même niveau d’effort ». Ce serait dû à l’imposition du mode « Adaptative Thinking » qui laisse le modèle choisir le niveau d’effort nécessaire en fonction de la tâche.

La seule véritable concession faite par Anthropic est d’abaisser la taille minimale du prompt pouvant être mis en cache à 1024 tokens au lieu de 4096 tokens avec Claude Opus 4.7. Le prix pour 5 minutes en cache est de 6,25 dollars pour un million de tokens, la lecture du cache et de son rafraîchissement coûte 50 centimes de dollar pour ce même volume.

Il y a toutefois une forte attente des usagers qui ont boudé Opus 4.7. « J’espère que 4.8 est plus proche de 4.6 en matière de nuances sur les sujets complexes », commente Ryan Sherman, responsable commercial et marketing chez Transunion. « J’avais l’impression que 4.7 était feignant et pressé, même au niveau maximal d’effort. Les premiers prompts avec 4.8 ont l’air très prometteurs. J’ai hâte de le tester davantage ».

À noter que les clients communs d’AWS et d’Anthropic peuvent bénéficier « d’offres privées », depuis la disponibilité de la plateforme Claude sur AWS le 11 mai dernier. Comme le nom l’indique, les conditions tarifaires ne sont pas publiques et découlent d’une négociation directe avec Anthropic. LeMagIT imagine que les rabais sont calculés selon un engagement sur le volume de tokens consommés annuellement.

Claude opus 4.8 est disponible sur AWS, Google Cloud et Microsoft Azure, ainsi que depuis de nombreux outils, dont GitHub Copilot, Notion ou Cursor.

LLM gourmands, demande forte et IPO en vue : Anthropic lève 65 milliards de dollars

Anthropic justifie sa levée de fonds par la nécessité d’augmenter ses ressources de calcul fortement sollicités en raison de la popularité de ses modèles d’IA très puissants, mais très gourmands. Claude Opus 4.8 ne changera pas la donne.

Anthropic s’impose face à OpenAI

Les clients face au défi de la maîtrise de la facture

Claude Opus 4.8 : plus pertinent pour les usages agentiques, mais peu efficient

Pour approfondir sur IA appliquée, GenAI, IA infusée

Gemini 3.5 Flash est rapide, mais pas aussi intéressant que l’affirme Google

Toutes les APIs d’Anthropic sont désormais accessibles directement depuis AWS

GPT-5.5 : les promesses d’OpenAI contredites par les premiers retours

Copilot : GitHub restreint l’accès aux abonnés individuels