De nieuwste onderneming van Google, met de codenaam “Project Jarvis”, zal AI gebruiken om webgebaseerde taken binnen de Chrome-browser te automatiseren.
Volgens De informatiedit door AI aangedreven project, dat naar verwachting in de vroege previews in december zal debuteren, wordt aangedreven door Google’s Gemini 2.0 model en vertegenwoordigt een op de consument gericht hulpmiddel dat gericht is op het vereenvoudigen van online interacties. Gemodelleerd naar Marvel’s fictieve JARVIS-assistent, zal Jarvis autonoom uit meerdere stappen bestaande digitale taken uitvoeren, variërend van online winkelen tot het boeken van reizen.
Gemini 2.0 drijft Project Jarvis aan
Gemini 2.0, de nieuwste versie van het geavanceerde AI-model van Google, dient als basis voor Project Jarvis. Onthuld op Google I/O 2024Gemini is ontworpen met verbeteringen op het gebied van redeneren, plannen en geheugen, allemaal gericht op het helpen van gebruikers bij het zelfstandig uitvoeren van complexe, uit meerdere stappen bestaande taken.
Zoals Google-CEO Sundar Pichai tijdens I/O uitlegde, is het doel om “intelligente systemen te creëren die redeneren, plannen en geheugen tonen, [and are] in staat om meerdere stappen vooruit te denken” en tegelijkertijd volledig onder toezicht van de gebruiker te blijven. Met deze mogelijkheden wil Gemini een “vlaggenschip voorbeeld”van hoe toekomstige AI-agenten de productiviteit kunnen verbeteren en de input van gebruikers kunnen verminderen.

Wat Jarvis onderscheidt is zijn vermogen om binnen de grenzen van de wereld te opereren Chroom browser, schermafbeeldingen maken om de interacties met onlineformulieren en knoppen te begeleiden. Volgens The Information maakt Jarvis regelmatig schermafbeeldingen van het Chrome-venster van een gebruiker om elke interface te interpreteren, waardoor deze op knoppen kan ‘klikken’, in velden kan typen of zelfs items op websites kan vergelijken.
Dankzij de screenshot-gestuurde methode kan Jarvis dat ook complexe vormen begrijpen en lay-outs die sterk variëren op verschillende sites. Deze functie betekent echter dat Jarvis relatief langzaam werkt en een paar seconden nodig heeft om elke schermafbeelding te analyseren voordat hij doorgaat met de volgende stap. Hoewel nog niet geoptimaliseerd voor snelheid, demonstreert deze technologie de strategie van Google om cloudgebaseerde bronnen te gebruiken ter ondersteuning van complexe AI-taken waarvoor anders verwerkingskracht op het apparaat nodig zou zijn.
Hoe zit het met applicaties?
Project Jarvis belooft de manier te veranderen waarop gebruikers omgaan met digitale platforms, met de nadruk op het automatiseren van routinematige webgebaseerde taken zoals het kopen van producten, het boeken van vluchten of het verzamelen van onderzoek.
Deze mogelijkheid zou een breed publiek kunnen aanspreken, van drukke professionals tot gewone gebruikers die taken willen stroomlijnen. Het rapport van The Information benadrukt dat Met Jarvis kunnen gebruikers uitgebreide webgebaseerde processen voltooien met minimale invoerwaardoor ze tijdrovende activiteiten aan de AI kunnen delegeren. Hiermee wil Google Jarvis positioneren als een op de consument gerichte, productiviteitsgerichte tool De Copilot-visie van Microsoft of die van Apple Apple-intelligentie.
Wanneer hebben gebruikers toegang tot Google Jarvis?
Rapporten suggereren dat een vroege preview van Project Jarvis debuteert mogelijk in decemberhoewel de details kunnen veranderen. Het bedrijf zal de tool waarschijnlijk in eerste instantie aan een beperkt publiek uitbrengen om eventuele bugs of beperkingen te identificeren en aan te pakken voordat deze op grotere schaal wordt uitgerold.
Google heeft een vergelijkbare aanpak gebruikt voor eerdere productlanceringen, zoals zijn Bard AIwaardoor vroege gebruikers de kans krijgen om feedback te geven en bij te dragen aan verfijningen voordat deze breder beschikbaar komen. Deze testfase zou vorm kunnen geven aan de manier waarop Google Jarvis optimaliseert voor snellere, meer naadloze prestaties en tegelijkertijd ervoor zorgt dat beveiligingsprotocollen voldoen aan de verwachtingen van de gebruiker.

Daar komen de zorgen
Als AI-assistent met aanzienlijke controle over de webervaring van een gebruiker werpt Jarvis nieuwe zorgen op het gebied van privacy en veiligheid op. Omdat Jarvis afhankelijk is van het interpreteren van schermafbeeldingen van potentieel gevoelige informatie, zullen robuuste beveiligingsmaatregelen essentieel zijn om ervoor te zorgen dat gebruikersgegevens beschermd blijven. Het plan van Google omvat zware tests van deze waarborgen voordat Jarvis een bredere release ziet, maar de potentiële risico’s die gepaard gaan met een dergelijk hoog niveau van systeemtoegang zorgen voor discussie onder privacyvoorstanders en ontwikkelaars.
Door AI-tools zoals Jarvis directe controle te geven over de apparaten van gebruikers, moet Google veiligheidsmaatregelen implementeren om kwetsbaarheden en ongeoorloofde toegang te voorkomen. Hoewel Project Jarvis nog in ontwikkeling is, belooft het een game-changer te worden op het gebied van AI-gestuurde productiviteit door gebruikers in staat te stellen complexe, uit meerdere stappen bestaande taken binnen de Chrome-browser te delegeren. Door de kracht van Gemini 2.0 te combineren met de webmogelijkheden van Chrome, creëert Google een AI die de manier waarop we digitale taken benaderen, van winkelen tot onderzoek, opnieuw zou kunnen definiëren.
Nu Google de laatste hand legt aan Jarvis voor consumentengebruik, kan het succes ervan de weg vrijmaken voor meer geavanceerde en autonome AI-ervaringen, waardoor de manier waarop we omgaan met browsers en mogelijk ook met de technologie in het algemeen verandert.
Afbeeldingscredits: Emre Çıtak/Ideogram AI