OpenAI dévoile « un agent qui travaille pour vous »

OpenAI fait converger ses outils de navigation sur le web et de recherche approfondie dans un agent capable d’agir de manière proactive. Conscient des détournements possibles de cette automatisation avancée, l’éditeur a renforcé les mesures de contrôles et de sécurité.

OpenAI lance son agent. « ChatGPT Agent », c’est son nom, est une évolution qui permet à ChatGPT de converser et de « raisonner », comme auparavant, mais aussi à présent d’agir de manière proactive et d’exécuter des tâches complexes.

L’agent, dans la lignée des modèles o3 d’OpenAI, utilise un ordinateur virtuel « sur lequel sont installées de nombreuses applications et que l’agent sait choisir en fonction de la demande », explique la vidéo de présentation de l’outil.

Il s’appuie sur les précédentes fonctionnalités d’« Operator » (qui pouvait naviguer sur le web) et de « DeepResearch » (pour l’analyse et la recherche et la synthèse d’informations) – dont il est, en quelque sorte, la convergence, dixit Sam Altman, PDG d’OpenAI.

« ChatGPT peut désormais travailler pour vous, à vos côtés » vante l’éditeur.

L’agent de ChatGPT « travaille » pour faire une visualisation de données stockées dans Google Drive
L’agent de ChatGPT « travaille » pour faire une visualisation de données stockées dans Google Drive

Des usages professionnels pertinents avec les connecteurs

L’agent est conçu pour gérer des requêtes complexes et des tâches de de bout en bout.

« Ces capacités agentiques améliorent considérablement l’utilité de ChatGPT dans les contextes quotidiens et professionnels »
OpenAI

L’éditeur donne plusieurs exemples de cas d’usages dans l’opérationnel quotidien (« regarder mon calendrier et me briefer sur les réunions clients à venir basées sur l’actualité récente »), dans la prise de décision (« analyser trois concurrents et créer un diaporama ») ou dans l’action (« organise un séminaire pour notre équipe de 40 personnes à moins de deux heures de transport (vol ou voiture) de Séville. Je veux un hôtel avec activités comme le tennis, restauration locale sur place, et disponible pour 3 nuits en octobre. Le budget est de 500 € par personne »).

L’agent navigue sur des sites, filtre les résultats, demande une connexion sécurisée si nécessaire, exécute du code, remplit des formulaires et effectue des analyses. Il sait également générer des « livrables » (diaporamas, feuilles de calcul, rapports, etc.) et planifier des tâches récurrentes (un rapport métrique hebdomadaire).

En milieu professionnel, l’outil prend tout son intérêt s’il est connecté à des applications métiers.

Cet interfaçage peut se faire via les connecteurs natifs d’OpenAI (Github, Drive, Box, Dropbox, Hubspot, etc – disponibles en fonction des plans), soit avec des connecteurs « personnalisés » (en suivant le modèle MCP).

Avec une grande automatisation vient une grande responsabilité

La promesse des agents est une capacité d’automatisation accrue. Ce qui pose dans le même temps des questions de gouvernances et de contrôle des « décisions » prises par l’IA qui orchestre les « sous agents » (ceux qui interagissent avec chaque système).

OpenAI en a bien conscience et insiste sur plusieurs garde-fous qu’il a mis en place.

En premier lieu, « l’humain reste dans la boucle ». L’utilisateur peut interrompre, clarifier, réorienter la tâche ou la modifier entièrement, et reprendre le contrôle à tout moment. ChatGPT demande également la permission avant d’entreprendre des actions (paiement, envoi de mail, valider un formulaire, etc.).

Quant aux ID (identifiants/mots de passe) de l’utilisateur, ils restent privés et ne sont ni collectées ni stockées par ChatGPT.

Deuxième point souligné par OpenAI, un accent tout particulier a été mis sur la protection contre les tentatives de manipulation du comportement de l’agent par des instructions malveillantes depuis le web (le « prompt injection »).

Une « narration » montre par ailleurs ce que fait l’agent de ChatGPT au fur et à mesure.

Enfin, l’agent est entraîné à refuser les tâches à haut risque. Et en particulier – un point très documenté par OpenAI – pour toutes les tâches qui aboutiraient à la création de produits chimiques et biologiques dangereux.

Pas encore disponible en France

« Ces capacités agentiques unifiées améliorent considérablement l’utilité de ChatGPT dans les contextes quotidiens et professionnels », assure OpenAI.

L’agent commence à être déployé pour les utilisateurs Pro, Plus et Team. Mais l’outil n’est pas encore disponible en France.

« Certaines régions nécessitent encore des validations externes avant le lancement de nouveaux produits », justifie l’éditeur.

Pour approfondir sur IA appliquée, GenAI, IA infusée