OpenAI Operator : voici l’avenir des agents d’IA

Le PDG d’OpenAI, Sam Altman, a déclaré dans un billet de blogue que 2025 serait une grande année pour les agents d’IA. Son agent Operator en témoigne. 

Jeudi, OpenAI a annoncé le lancement d’un aperçu de recherche d’Operator, un agent d’IA polyvalent capable de prendre le contrôle d’un navigateur Web et d’effectuer certaines actions de manière indépendante. L’outil sera d’abord proposé aux utilisateurs américains dans le cadre du forfait d’abonnement Pro à 20$ de ChatGPT. OpenAI, qui ne manque pas d’ambition, prévoit le déployer à un plus grand nombre d’utilisateurs de ses niveaux Plus, Team et Enterprise par la suite.

Cet aperçu de recherche initial est disponible sur operator.chatgpt.com, mais OpenAI indique qu’elle souhaite bientôt intégrer Operator dans tous ses clients ChatGPT.

Laissez Operator automatiser vos tâches

Operator promet d’automatiser des tâches telles que la réservation de voyages, la réservation de restaurants et les achats en ligne. Il existe plusieurs catégories de tâches que les utilisateurs peuvent choisir dans l’interface d’Operator, notamment les achats, la livraison, la restauration et les voyages, qui permettent toutes différents types d’automatisation.

Lorsque les utilisateurs de ChatGPT activent Operator, une petite fenêtre apparaît, affichant un navigateur Web dédié, ainsi que des explications sur les actions spécifiques que l’agent effectue. Les utilisateurs peuvent toujours prendre le contrôle de leur écran pendant qu’Operator travaille.

Operator est alimenté par un modèle d’agent d’utilisation d’ordinateur (CUA) qui combine les capacités de vision du modèle GPT-4o et les capacités de raisonnement des modèles plus avancés d’OpenAI. Le CUA est entraîné à interagir avec l’interface utilisateur des sites Web, ce qui signifie qu’il n’a pas besoin d’utiliser des API destinées aux développeurs pour exploiter différents services.

Autrement dit, le CUA peut utiliser des boutons, naviguer dans des menus et remplir des formulaires sur une page Web comme le ferait un humain.

Partenariats stratégiques

OpenAI collabore avec DoorDash, eBay, Instacart, Priceline, StubHub et Uber pour s’assurer qu’Operator respecte leurs conditions d’utilisation.

Le modèle CUA est entraîné à demander la confirmation de l’utilisateur avant de finaliser des tâches ayant des effets secondaires externes, par exemple avant de soumettre une commande, d’envoyer un courriel, etc., afin que l’utilisateur puisse vérifier le travail du modèle avant qu’il ne devienne permanent.

Car Operator n’est pas parfait. Il ne peut pas gérer de manière fiable de nombreuses tâches complexes ou spécialisées comme la création de présentations détaillées, la gestion de calendriers complexes ou l’interaction avec des interfaces Web personnalisées ou non standard.

OpenAI exige également une supervision pour les transactions bancaires, même si Operator pourrait les effectuer en grande partie seul. Les utilisateurs devront prendre le relais pour saisir les informations de carte de crédit, par exemple. 

Cela limite l’utilité d’Operator, c’est certain, mais cela garantit également que l’agent ne s’égare pas et vide votre compte bancaire en achetant trop de papier de toilette. À ce stade de la publication, Operator refusera également d’effectuer des tâches purement et simplement pour des raisons de sécurité, comme l’envoi de courriels (malgré le fait que le CUA en soit capable) et la suppression d’événements de calendrier. OpenAI affirme que cela changera à l’avenir, mais ne donne pas de date.