OpenAI brengt mogelijk binnenkort een AI-tool uit die in staat is de controle over de pc’s van gebruikers over te nemen en namens hen acties uit te voeren, de zogenaamde Operator-tool. Software-ingenieur Tibor Blaho, bekend om het nauwkeurig lekken van aankomende AI-producten, beweringen bewijsmateriaal te hebben gevonden dat deze ontwikkeling ondersteunt.
OpenAI plant de lancering in januari van de AI-tool Operator
OpenAI streeft naar verluidt naar een Lancering van Operator in januari. Blaho’s recente ontdekkingen omvatten verborgen opties in OpenAI’s ChatGPT-client voor macOS waarmee gebruikers snelkoppelingen naar “Toggle Operator” en “Force Quit Operator” kunnen definiëren. Verder merkt Blaho op dat OpenAI verwijzingen naar Operator op haar website heeft toegevoegd, hoewel deze verwijzingen nog niet publiekelijk zichtbaar zijn.
OpenAI lanceert in januari de autonome AI-agent Operator
Volgens Blaho bevat de website ook ongepubliceerde tabellen waarin de prestaties van Operator worden vergeleken met andere computergestuurde AI-systemen. Als de cijfers kloppen, geven ze aan dat Operator niet geheel betrouwbaar is, afhankelijk van de taak. In een benchmark op OSWorld, die een echte computeromgeving simuleert, scoorde de “OpenAI Computer Use Agent (CUA)” bijvoorbeeld 38,1%, beter dan het model van Anthropic, maar aanzienlijk lager dan de score van 72,4% die door mensen werd behaald. De OpenAI CUA presteert beter dan menselijke agenten op de WebVoyager-test, die de webnavigatievaardigheden van een AI beoordeelt, maar presteert ondermaats op een andere benchmark, WebArena.

De operator lijkt te worstelen met taken die doorgaans gemakkelijk zijn voor mensen. Bij tests waarbij Operator zich moest aanmelden bij een cloudprovider en een virtuele machine moest lanceren, slaagde dit in 60% van de gevallen. Ondertussen slaagde het er volgens het gelekte document slechts 10% van de tijd in om een Bitcoin-portemonnee te creëren benchmarks.
OpenAI betreedt de AI-agentruimte in een tijd waarin concurrenten als Anthropic en Google ook op dit gebied vooruitgang boeken. Analysebureau Markets and Markets voorspelt dat de markt voor AI-agents in 2030 47,1 miljard dollar zou kunnen bereiken. Hoewel AI-agents zich nog in een primitief ontwikkelingsstadium bevinden, uiten sommige experts hun zorgen over hun veiligheid, vooral als de technologie snel verbetert.
Eén uitgelekte grafiek geeft aan dat Operator goed presteert in bepaalde veiligheidsevaluaties, met name bij het weerstaan van pogingen tot illegale activiteiten en het zoeken naar gevoelige persoonlijke gegevens. Naar verluidt hebben veiligheidstests bijgedragen aan de lange ontwikkelingscyclus van Operator. OpenAI-medeoprichter Wojciech Zaremba bekritiseerd De recente release van Anthropic vanwege het ontbreken van veiligheidsmaatregelen, wat wijst op mogelijke reacties als OpenAI een soortgelijke release zou bespoedigen.
Er is kritiek geuit op OpenAI door AI-onderzoekers en voormalig personeel omdat ze naar verluidt prioriteit zouden geven aan de snelle productie van technologie boven veiligheidsmaatregelen.
Afbeelding tegoed: Tibor Blaho