OpenAI annuncia un’anteprima di ricerca di Operator, un agente che può navigare sul web per eseguire compiti al posto degli utenti.
Operator si basa su Computer-Using Agent (CUA), un modello che combina le capacità di visione di GPT-4o con un ragionamento avanzato attraverso l’apprendimento potenziato. CUA è addestrato a interagire con le interfacce grafiche (GUI) – i pulsanti, i menù e i campi di testo usati quotidianamente dagli utenti – dandogli la flessibilità di navigare negli ambienti digitali senza richiedere API specifiche per il sistema operativo o il web.
Per consentire un rollout sicuro e iterativo, questa preview di Operator sarà disponibile per gli utenti Pro negli Stati Uniti all’indirizzo opertor.chatgpt.com. In questo modo, Operator potrà imparare dall’utilizzo dei primi utenti e perfezionare le sue funzionalità, migliorando nel tempo. L’obiettivo di OpenAI è di estendere la disponibilità di Operator agli utenti Plus, Team ed Enterprise, nonché di integrare queste funzionalità in ChatGPT.
CUA beneficia dei progressi in termini di ragionamento, multimodalità e sicurezza, ponendo le basi per agenti come Operator affinché possano completare compiti complessi e in più fasi per gli utenti. Questo è l’inizio di un futuro in cui l’intelligenza artificiale non si limita a fornire informazioni, ma è anche in grado di eseguire autonomamente i flussi di lavoro, aiutando sia le aziende sia i privati.
Inoltre, OpenAI ha implementato rigorose misure di sicurezza per garantire un uso sicuro e responsabile di Operator. Maggiori informazioni disponibili nella Scheda di Sistema di Operator.