OpenAI llança l’agent intel·ligent Operator a Europa

L’eina, publicada a finals de gener als Estats Units, pot dur a terme de manera autònoma tasques en un navegador d’internet, com omplir formularis o preparar compres digitals

Redacció

Operator es troba només disponible per als usuaris de ChatGPT Pro, la subscripció més cara del servei d'OpenAI
Operator es troba només disponible per als usuaris de ChatGPT Pro, la subscripció més cara del servei d'OpenAI | OpenAI

OpenAI ha anunciat aquest dijous que el seu agent intel·ligent en fase experimental Operator ja es troba disponible a tots els països de la Unió Europea, Suïssa, Noruega, Liechtenstein i Islàndia per als usuaris amb subscripció ChatGPT Pro. Aquesta nova eina, publicada a finals de gener als Estats Units, es defineix com un assistent que pot efectuar diverses tasques en un navegador d’internet propi, com ara emplenar formularis, fer compres en línia o “fins i tot crear mems”, segons assegurava l’empresa en el seu comunicat inicial.

Operator funciona a través del model Computer-Using Agent (CUA), que al seu torn es basa en les capacitats de visió i de raonament profund de GPT-4o i ha estat entrenat amb interfícies gràfiques d’usuari (GUI) per comprendre com funciona la navegació. Gràcies a això, l’agent pot “veure” a través de les captures de pantalles i “interactuar” amb els elements del navegador fent servir les eines que tindria una persona humana, és a dir, un ratolí i un teclat. En la demostració en vídeo compartida per OpenAI es pot veure com l’usuari demana a Operator que cerqui una recepta a un portal web i que després es dirigeixi a una altra web, aquesta de comerç electrònic, per comprar els ingredients que són necessaris.

La manera d’interactuar amb Operator és molt similar a la resta d’eines d’OpenAI: a través de la interfície de xat que ofereix la plataforma, només cal descriure textualment la tasca que es vol que el programari dugui a terme. A continuació, l’eina començarà a fer el procés, el qual mostrarà en directe retransmetent el navegador amb què està interactuant. En qualsevol moment del procés, l’usuari pot interrompre Operator i prendre el control, o bé donar-li instruccions addicionals. Al mateix temps, l’eina també pot trobar-se en moments en què dubti quin pas fer a continuació i ho pregunti a través del xat per tenir la resposta de l’usuari. Quan es tracti de qüestions delicades, com pot ser l’adquisició de productes o el pagament d’algun servei, l’agent sempre demanarà confirmació a la persona abans d’efectuar-ho.