Connexion Abonnez-vous

OpenAI dégaine son ChatGPT Agent, qui prétend pouvoir presque tout faire

Bonjour M. Anderson

OpenAI dégaine son ChatGPT Agent, qui prétend pouvoir presque tout faire

L’entreprise vient de lancer un nouveau produit, qui promet de réaliser et d’automatiser la plupart des tâches du quotidien. Indisponible en Europe et réservé pour l’instant aux formules payantes, ChatGPT Agent marque en quelque sorte un aboutissement.

Le 18 juillet à 14h38

Les agents sont souvent présentés comme l’émanation ultime de l’IA générative. Ce sont des automates à qui l’on confie une mission. Ils sont chargés d’effectuer une ou plusieurs tâches, selon leur programmation et le contexte. Leur rôle premier est d’automatiser des tâches, en fonction des données reçues. L’industrie de l’IA est en ébullition autour du concept et des technologies transversales émergent, comme A2A chez Google (reprise par d’autres) pour standardiser la manière dont les agents exposent leurs capacités aux autres éléments.

ChatGPT Agent se définit comme un agent général, conçu pour effectuer un vaste ensemble de tâches via un prompt. Contrairement à des sociétés comme Perplexity qui lancent leur propre navigateur pour descendre dans l’arène, le nouveau produit d’OpenAI arrive sous la forme d’une fonction supplémentaire dans le client ChatGPT, équipée d’un navigateur pour réaliser ses missions en ligne (quand il y en a).

La société évoque « un système agentique unifié combinant le navigateur à distance d'Operator, la synthèse web de Deep Research, et les forces conversationnelles de ChatGPT ».

Ce que sait faire ChatGPT Agent

OpenAI annonce que son produit est beaucoup plus performant que tous les agents généraux lancés jusqu’à présent. Les possibilités annoncées sont ainsi nombreuses. On peut y connecter notamment de nombreuses sources de données, notamment les services de Google, pour automatiser des tâches. Dans sa présentation, OpenAI indique qu’Agent permet justement de répondre à la plus grosse critique faite jusqu’à présent à Deep Search : l’impossibilité de se connecter sur des sites pour en récupérer les informations.

Dans les exemples donnés, OpenAI cite la planification et l’achat des ingrédients nécessaires à l’organisation d’un petit-déjeuner japonais pour quatre personnes ou encore l’analyse de plusieurs concurrents pour créer un jeu de diapositives. On peut en citer d’autres : automatiser la récupération des pièces jointes provenant de certains courriels pour les stocker dans un dossier spécifique dans un drive, planifier un voyage en s’occupant de toutes les démarches, etc.

« Au travail, vous pouvez automatiser des tâches répétitives, comme la conversion de captures d'écran ou de tableaux de bord en présentations composées d'éléments vectoriels modifiables, la réorganisation de réunions, la planification et la réservation de réunions hors site, et la mise à jour de feuilles de calcul avec de nouvelles données financières tout en conservant le même formatage », ajoute l’entreprise.

ChatGPT Agent est disponible partout, sauf en Europe et en Suisse. De plus, les comptes gratuits n’y ont pas accès. Il faut avoir au moins un abonnement Plus ou Team pour en profiter, avec une limite de 40 utilisations par mois. Dans la formule Pro, à 200 dollars par mois, on peut s’en servir 400 fois par mois.

Côté technique et sécurité

On ne peut pas dire que les agents aient particulièrement brillé jusqu’à présent quand ils se sont frottés au monde réel. OpenAI indique que sa fonction Agent se débrouille beaucoup mieux, avec un score de 41,6 % au test Humanity's Last Exam, jugé difficile. C’est le double des résultats obtenus par deux autres modèles de l’entreprise, o3 et o4-mini. Sur FrontierMath, ChatGPT Agent a obtenu 27,4 %, à comparer aux 6,3 % d’o4-mini. OpenAI ne donne cependant pas de résultats pour les modèles concurrents, à l’exception notable de Copilot pour des opérations sur les fichiers Excel.

La société indique que ChatGPT Agent exécute les tâches « à l'aide de son propre ordinateur virtuel, passant avec fluidité du raisonnement à l'action pour gérer des flux de travail complexes du début à la fin, en fonction de vos instructions ».

La sécurité de la fonction pourrait cependant poser problème. Le rapport de sécurité attenant pointe « une capacité élevée » de la fonction dans le domaine des armes biologiques et chimiques. La société indique ne pas avoir constaté réellement ces capacités, mais le potentiel d’amplification des « voies existantes vers des dommages graves » est jugé sérieux. Des protections supplémentaires ont donc été activées, dont une fonction de surveillance chargée d’inspecter les résultats au fur et à mesure. Un autre outil inspecte la réponse générale.

En outre, la fonction Mémoire a été désactivée sur Agent. Selon OpenAI, le risque existerait sinon que des attaques par injection permettent la récupération d’informations sensibles lors des requêtes. Il est également important de noter qu’aucune action irréversible n’est effectuée sans demander l’autorisation. Une protection valable aussi bien pour un paiement en ligne que l’envoi d’un e-mail. Ce qui fait dire à OpenAI que son produit est un « agent qui travaille pour vous, avec vous ». En outre, certaines actions à haut risque sont explicitement bloquées, comme les virements bancaires.

ChatGPT ne ferait qu’exploiter les données existantes. OpenAI affirme que les entrées restent privées et qu’Agent « ne collecte ni ne stocke les données que vous saisissez au cours de ces sessions, telles que les mots de passe, car le modèle n'en a pas besoin et il est plus sûr qu'il ne les voie jamais ».

Du temps devant soi

OpenAI indique que ChatGPT Agent n’en est qu’à ses débuts et qu’il peut faire des erreurs. Ce serait particulièrement vrai avec la génération de diapositives, dont les résultats « peuvent parfois sembler rudimentaires en termes de formatage et de finition ». Cette fonction est d’ailleurs présentée comme étant en bêta. Une nouvelle version de ce composant est en cours de formation.

De manière générale, on manque encore de retours réels sur la fonction. On sait en revanche que certaines actions peuvent prendre du temps, voire beaucoup de temps, jusqu’à 15 ou 30 minutes selon la complexité de la requête.

L’ensemble sera suivi de près, car les ambitions d’OpenAI sont nombreuses avec son Agent. La question de la sécurité est également prégnante, même si l’entreprise aborde directement la question dans son annonce, en plus de son rapport de sécurité.

Commentaires (5)

votre avatar
Flock represent, au top l'illustration :D
votre avatar
j'comprends pas grand chose à ces merdes, surtout je tique quand je lis : "Des protections supplémentaires ont donc été activées, dont une fonction de surveillance chargée d’inspecter les résultats au fur et à mesure. Un autre outil inspecte la réponse générale."
C'est qui qui inspecte les résultats ? et donc c'est qui qui se gave de tout ce que veulent faire les clients ? et donc ça sert à quoi en fait ?
sans doute pas à aider vraiment qui que ce soit.
Me tromp'je ?
votre avatar
Il y a un autre programme qui inspecte ce que génère l IA au fur au et à mesure.
Sur le même principe de ce qu'on voyait vers le début avec ChatGPT qui commençait a rédigé une réponse, puis la réponse disparaissait s'il y avait certains mots clés sensibles dans la réponse.
Une forme d'auto censure pour éviter des sujets sensibles.

"ça sert à quoi en fait ? "
Je ne suis pas sur à quoi fait référence le "ça", les outils d inspection ou l Agent IA, mais j'espère que ça répond à ta question.
Il est d ailleurs bien indiqué "ne collecte ni ne stocke les données que vous saisissez au cours de ces sessions". Si tu n'as pas confiance dans ces déclarations, c'est une autre histoire.
En tout cas, les outils d'inspection dont ils parlent ont une fonction bien réel.
Ça n exclu pas qu'il y ait de la collecte par ailleurs, je suis surpris qu'ils ne se réservent pas le droit de collecter des données des sessions pour améliorer l IA
votre avatar
À voir si c'est pas c'est pas juste que ça collecte pas les informations "au cours" des sessions
Du genre : il a bien enregistré que tu voulais faire un sushi avec ta femme, il a bien enregistré tout on agenda, mais il a pas retenu le numéro de ta CB qui sert à faire l'achat en ligne des fleurs que tu veux faire livrer
votre avatar
la réorganisation de réunions
C'est quoi ?

OpenAI dégaine son ChatGPT Agent, qui prétend pouvoir presque tout faire

  • Ce que sait faire ChatGPT Agent

  • Côté technique et sécurité

  • Du temps devant soi

Fermer