Avec GPT-5.2, OpenAI se recentre sur les entreprises
Après le décevant GPT-5 et l’anecdotique GPT-5.1, OpenAI s’attelle à convaincre les entreprises des bénéfices de sa nouvelle collection censée battre Anthropic, Google… et les métiers. Des gains qui se monnaient cher : Artificial Analysis note une hausse de 40 % des prix des appels via API.
Avec le lancement de GPT-5.2, OpenAI s’adresse aux professionnels, un terme répété une quinzaine de fois dans le billet de blog qui accompagne cette sortie.
Ce semblant d’analyse sémantique reflète probablement la volonté d’OpenAI d’angler ces sorties sur une thématique ciblant une partie de sa clientèle et de ses utilisateurs.
La précédente mise à jour mineure, GPT-5.1, cherchait davantage à rétablir les tons manquants aux aficionados de GPT-4o. Désormais, il faut répondre aux exigences des entreprises, dans un contexte tendu pour la startup, selon les analystes financiers.
Ce lancement pourrait aussi refléter le sentiment d’urgence vécu par OpenAI face à Google et Anthropic. GPT-5.1 n’a été lancé qu’il y a un mois. Qui plus est, la startup dirigée par Sam Altman avait loupé le lancement de GPT-5.
Le billet de blog en français, qui annonce la disponibilité du modèle de raisonnement multimodal (texte et image en entrée, texte en sortie) GPT-5.2, contient des éléments de remplissage. Un signe que des validations étaient attendues ou que la page a été publiée à la hâte. OpenAI voulait nommer ses clients qui exploitent la partie vision du modèle (dénommé A, B et C dans le document). Des mentions qui ne sont pas présentes dans le billet publié en direction du public américain.
Auprès de la presse et selon nos confrères de Wired, Fidji Simo (CEO Applications chez OpenAI) confirme l’existence d’un « code rouge » consacré majoritairement à ChatGPT. Une mise en alerte qui n’a pas précipité la sortie de GPT-5.2, entraîné pendant plusieurs mois. Ce signal d’alerte aurait permis de concentrer les ressources sur l’assistant IA. Puisque les modèles sont d’abord disponibles depuis l’application phare d’OpenAI, ces bras supplémentaires ont été « utiles » dans le cadre du lancement de GPT 5.2.
« Égaler ou surpasser »… les humains
Ce qui n’empêche pas la startup d’affiner son marketing. Bien que multitâche, GPT 5,2 Thinking est présenté comme le « modèle de pointe le plus avancé » pour les développeurs d’API.
Sur le benchmark SWE-Bench, consacré à la programmation en Python, GPT-5.2 obtient 80 %, contre 80,9 % pour Claude Opus 4.5 et 76,2 % pour Gemini 3 Pro.
GPT-5.2 Instant serait idéal pour motoriser un assistant IA métier (traduction, guides pratiques, rédaction technique). Enfin, GPT-5.2 Pro est destiné à la recherche profonde, pour propulser certains assistants IA destinés à des experts ou accomplir des tâches complexes de programmation.
« GPT‑5.2 Thinking surpasse ou égale les meilleurs professionnels du secteur sur 70,7 % des tâches de travail intellectuel complexes, selon l’évaluation de juges humains experts. »
Porte-parole d’OpenAI
Outre le fait que GPT-5.2 surpasse ses prédécesseurs et tienne son rang face à ses concurrents, OpenAI assume que sa technologie peut remplacer des experts métiers. C’est tout l’objet du benchmark GDPval créée par l’éditeur. Celui-ci évalue les performances des modèles de langage sur 1 320 tâches spécialisées liées à 44 professions exerçant dans neuf secteurs contribuant le plus au PIB des États-Unis.
« GPT‑5.2 Thinking surpasse ou égale les meilleurs professionnels du secteur sur 70,7 % des tâches de travail intellectuel complexes, selon l’évaluation de juges humains experts », assurent les porte-parole d’OpenAI. « Ces tâches incluent la création de présentations, de feuilles de calcul et d’autres livrables », poursuivent-ils. « GPT‑5.2 Thinking a accompli ces tâches à une vitesse environ trois fois supérieure, et pour un coût d’environ 1 % de celui d’experts humains ».
Le fournisseur ne précise pas que ces tâches sont évaluées sur une seule passe. Il prend tout de même la peine de citer un évaluateur qui perçoit « un bond en avant », malgré « quelques erreurs mineures à corriger » dans les livrables.
GPT-5.2 Thinking ferait des réponses comportant moins fréquemment d’erreurs de véracité que GPT-5.1 Thinking (-38 % selon le billet français, -30 % selon le blog américain). Or, ces erreurs sont détectées par d’autres LLM as a judge. Ceux-là « peuvent aussi en commettre ». Et la recherche Web ne suffit pas toujours pour les identifier. OpenAI assure qu’il a encore amélioré la résistance de ses LLM aux biais et aux attaques. Le cabinet Appolo Research a été appelé en renfort pour vérifier si GPT-5.2 est capable de causer des « dommages catastrophiques ». Comme pour ses compétiteurs, le spécialiste du red teaming a conclu que le modèle n’est pas dangereux à grande échelle.
GPT-5.2 : une des collections de modèles les plus chères du marché
OpenAI ne se compare pas à ses concurrents. Selon les tests menés par le cabinet Artificial Analysis, GPT-5.2 vient de prendre la place de Claude Opus 4.5 sur GDPvalAA, une version allégée du parangonnage (220 tâches, contre 1320) évoqué plus haut.
« Cependant, GPT-5.2 est le modèle le plus cher pour exécuter ce benchmark : il coûte 620 dollars, contre 608 dollars pour Claude Opus 4.5 et 88 dollars pour GPT-5 », relate le cabinet d’analyse spécialisée dans l’IA.
« Cela s’explique par l’utilisation de six fois plus de tokens par GPT-5.2 que GPT-5.1 (250 millions contre 40 millions) et par le fait qu’OpenAI a augmenté ses prix de 40 % », note-t-il.
Néanmoins, la durée de raisonnement est désormais fonction de cinq modes (aucun, bas, moyen, haut, et très haut), tandis qu’il est possible de faire varier la verbosité (bas, moyen et haut) du modèle.
« [GPT-5.2] reste toutefois moins cher que d’autres modèles de pointe, afin que les utilisateurs puissent continuer à l’utiliser largement dans leur travail quotidien et leurs applications essentielles. »
OpenAI
GPT-5.2 est facturé 1,75 dollar pour 1 million de tokens en entrée et 14 dollars pour le même volume de tokens en sortie (contre 1,25/10 dollars avec GPT-5.1). Pour les mêmes quotas, GPT-5.2 coûte 21 dollars en entrée et 168 dollars en sortie (15/120 dollars pour GPT-5 Pro).
Une hausse du tarif de l’API justifiée par les performances du modèle. « Il reste toutefois moins cher que d’autres modèles de pointe, afin que les utilisateurs puissent continuer à l’utiliser largement dans leur travail quotidien et leurs applications essentielles », avance OpenAI. Les prix des abonnements de ChatGPT « restent inchangés ».
Claude Opus 4.5 coûte 5 dollars pour 1 million de tokens en entrée et 25 dollars pour le même volume en sortie. La version 4.1 du modèle d’Anthropic est facturée 15 dollars pour 1 million de tokens en entrée, et 75 dollars en sortie. Le tarif Gemini 3 Pro oscille entre 2 et 4 dollars en entrée, et 12 et 18 dollars en sortie (le tarif le plus élevé correspond aux requêtes comptant plus de 200 000 tokens).
À la connaissance du MagIT, GPT-5.2 Pro apparaît comme le modèle plus cher accessible actuellement. Aux entreprises de déterminer par leurs propres tests si GPT-5.2 fait réellement mieux que Claude Opus 4.5 ou Gemini 3 Pro. D’autant que la propension de la société de Sam Altman à déconnecter ses propres modèles pourrait conduire à une hausse majeure de la facture.
« Nous n’avons pas pour l’instant le projet de déprécier GPT-5.1, GPT-5 ou GPT-4.1 dans l’API et nous communiquerons à l’avance nos intentions aux développeurs », promet le fournisseur de LLM. GPT-5.1 restera disponible encore trois mois pour les abonnés payants de ChatGPT.
OpenAI ne donne aucun détail pour expliquer les gains observés. GPT-5.2 dispose d’une fenêtre de contexte de 400 000 tokens et peut en générer 128 000 en un seul tir. Sa limite de connaissances s’arrête au 31 août 2025. La startup prend tout de même le temps pour remercier Microsoft et Nvidia. La collection a été entraînée sur des superclusters dotés de GPU Nvidia H100, H200 et GB200 NVL 72 installés dans les data centers de Microsoft Azure. D’ailleurs, GPT-5.2 est déjà accessible depuis plusieurs services Microsoft, dont Copilot.
Pour approfondir sur IA appliquée, GenAI, IA infusée