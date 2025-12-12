Avec le lancement de GPT-5.2, OpenAI s’adresse aux professionnels, un terme répété une quinzaine de fois dans le billet de blog qui accompagne cette sortie.

Ce semblant d’analyse sémantique reflète probablement la volonté d’OpenAI d’angler ces sorties sur une thématique ciblant une partie de sa clientèle et de ses utilisateurs.

La précédente mise à jour mineure, GPT-5.1, cherchait davantage à rétablir les tons manquants aux aficionados de GPT-4o. Désormais, il faut répondre aux exigences des entreprises, dans un contexte tendu pour la startup, selon les analystes financiers.

Ce lancement pourrait aussi refléter le sentiment d’urgence vécu par OpenAI face à Google et Anthropic. GPT-5.1 n’a été lancé qu’il y a un mois. Qui plus est, la startup dirigée par Sam Altman avait loupé le lancement de GPT-5.

Le billet de blog en français, qui annonce la disponibilité du modèle de raisonnement multimodal (texte et image en entrée, texte en sortie) GPT-5.2, contient des éléments de remplissage. Un signe que des validations étaient attendues ou que la page a été publiée à la hâte. OpenAI voulait nommer ses clients qui exploitent la partie vision du modèle (dénommé A, B et C dans le document). Des mentions qui ne sont pas présentes dans le billet publié en direction du public américain.

Auprès de la presse et selon nos confrères de Wired, Fidji Simo (CEO Applications chez OpenAI) confirme l’existence d’un « code rouge » consacré majoritairement à ChatGPT. Une mise en alerte qui n’a pas précipité la sortie de GPT-5.2, entraîné pendant plusieurs mois. Ce signal d’alerte aurait permis de concentrer les ressources sur l’assistant IA. Puisque les modèles sont d’abord disponibles depuis l’application phare d’OpenAI, ces bras supplémentaires ont été « utiles » dans le cadre du lancement de GPT 5.2.

« Égaler ou surpasser »… les humains Ce qui n’empêche pas la startup d’affiner son marketing. Bien que multitâche, GPT 5,2 Thinking est présenté comme le « modèle de pointe le plus avancé » pour les développeurs d’API. Sur le benchmark SWE-Bench, consacré à la programmation en Python, GPT-5.2 obtient 80 %, contre 80,9 % pour Claude Opus 4.5 et 76,2 % pour Gemini 3 Pro. GPT-5.2 Instant serait idéal pour motoriser un assistant IA métier (traduction, guides pratiques, rédaction technique). Enfin, GPT-5.2 Pro est destiné à la recherche profonde, pour propulser certains assistants IA destinés à des experts ou accomplir des tâches complexes de programmation. « GPT‑5.2 Thinking surpasse ou égale les meilleurs professionnels du secteur sur 70,7 % des tâches de travail intellectuel complexes, selon l’évaluation de juges humains experts. » Porte-parole d’OpenAI Outre le fait que GPT-5.2 surpasse ses prédécesseurs et tienne son rang face à ses concurrents, OpenAI assume que sa technologie peut remplacer des experts métiers. C’est tout l’objet du benchmark GDPval créée par l’éditeur. Celui-ci évalue les performances des modèles de langage sur 1 320 tâches spécialisées liées à 44 professions exerçant dans neuf secteurs contribuant le plus au PIB des États-Unis. « GPT‑5.2 Thinking surpasse ou égale les meilleurs professionnels du secteur sur 70,7 % des tâches de travail intellectuel complexes, selon l’évaluation de juges humains experts », assurent les porte-parole d’OpenAI. « Ces tâches incluent la création de présentations, de feuilles de calcul et d’autres livrables », poursuivent-ils. « GPT‑5.2 Thinking a accompli ces tâches à une vitesse environ trois fois supérieure, et pour un coût d’environ 1 % de celui d’experts humains ». Le fournisseur ne précise pas que ces tâches sont évaluées sur une seule passe. Il prend tout de même la peine de citer un évaluateur qui perçoit « un bond en avant », malgré « quelques erreurs mineures à corriger » dans les livrables. GPT-5.2 Thinking ferait des réponses comportant moins fréquemment d’erreurs de véracité que GPT-5.1 Thinking (-38 % selon le billet français, -30 % selon le blog américain). Or, ces erreurs sont détectées par d’autres LLM as a judge. Ceux-là « peuvent aussi en commettre ». Et la recherche Web ne suffit pas toujours pour les identifier. OpenAI assure qu’il a encore amélioré la résistance de ses LLM aux biais et aux attaques. Le cabinet Appolo Research a été appelé en renfort pour vérifier si GPT-5.2 est capable de causer des « dommages catastrophiques ». Comme pour ses compétiteurs, le spécialiste du red teaming a conclu que le modèle n’est pas dangereux à grande échelle.