DeepMind heeft geïntroduceerd Genie 2, een geavanceerd AI-model dat interactieve 3D-werelden kan genereren op basis van eenvoudige tekstbeschrijvingen en afbeeldingen. De opvolger van Genie 1, aangekondigd op 4 december 2024, creëert diverse virtuele omgevingen, waardoor gebruikers dynamisch kunnen communiceren via toetsenbord- en muisbediening en acties zoals springen en zwemmen kunnen simuleren. Het is getraind op verschillende video’s en kan interacties, natuurkunde en NPC-gedrag modelleren.
DeepMind lanceert Genie 2, een revolutionaire AI voor 3D-werelden
Genie 2 heeft de mogelijkheid om een breed scala aan 3D-scènes te visualiseren en biedt functionaliteiten die vergelijkbaar zijn met AAA-videogames. Door aanwijzingen te verwerken kan het model consistente omgevingen creëren, inclusief first-person en isometrische perspectieven die tussen de 10 en 20 seconden duren, waarvan sommige zelfs een minuut kunnen duren. De beweringen van DeepMind beweren dat het model delen van een scène onthoudt die niet direct zichtbaar zijn, en deze bij terugkeer nauwkeurig weergeeft. Dit staat in contrast met bestaande modellen zoals Decart’s Minecraft-simulator, die vaak worstelen met consistentie en resolutie.
Deze gelekte Battlemage Intel GPU’s zijn gamingbeesten
Het fundamentele element van Genie 2 is het verwerken van een referentiebeeld in combinatie met een tekstprompt, waardoor het genereren van zeer interactieve omgevingen wordt gestroomlijnd. Met een prompt als ‘Een schattige mensachtige robot in het bos’ kan het model bijvoorbeeld een overeenkomstige scène creëren. De toevoeging van complexe interacties, zoals het laten knallen van ballonnen of het navigeren door omgevingen, demonstreert de robuuste fysica-engine. Ondanks dergelijke mogelijkheden rijzen er zorgen over de interpretatie van de invoer door het model, met name of het onbedoeld auteursrechtelijk beschermde spelelementen repliceert vanwege een gebrek aan details met betrekking tot trainingsgegevensbronnen.
De implicaties voor intellectueel eigendom die voortvloeien uit de trainingsgegevens van Genie 2 roepen belangrijke vragen op. DeepMind profiteert van de uitgebreide toegang van Google tot YouTube, waarbij mogelijk video-inhoud wordt gebruikt voor modeltraining. Deze toegang leidt tot speculatie over het genereren van reproducties zonder licentie van geobserveerde games, wat een kwestie kan worden voor juridisch onderzoek. Terwijl het AI-model de grenzen van originaliteit vervaagt, doemt de bezorgdheid over ongeautoriseerde replicatie op.
Bevindingen uit een BEDRAAD Uit onderzoek blijkt dat grote bedrijven, waaronder Activision Blizzard, AI-technologieën gebruiken om processen te stroomlijnen, wat mogelijk tot banenverlies kan leiden. De introductie van Genie 2 kan het landschap verder compliceren, waar AI-tools de ontwikkeling versnellen en tegelijkertijd traditionele functies uitdagen.
DeepMind benadrukt de rol van Genie 2 bij het ontwikkelen van diverse evaluatietaken voor AI-agenten. Hoewel de computervereisten en de commercialiseringsvooruitzichten van het model onbekend blijven, wijzen de voortdurende ontwikkelingen op een evoluerende relatie tussen AI en game-ontwerp. Verschillende rapporten duiden op een toestroom van investeringen in wereldmodeltechnologieën, wat een cruciale verschuiving betekent in zowel AI-onderzoek als interactieve game-ervaringen. Deze trend resoneert met een groeiende fascinatie voor het potentieel van AI om de creatieve industrie opnieuw vorm te geven.
De gerichte wervingsinspanningen van DeepMind onderstrepen de toewijding aan baanbrekende ontwikkelingen. Hun strategische werving van talent van andere toonaangevende AI-bedrijven versterkt hun intentie om voorop te blijven lopen op het gebied van generatieve AI-technologieën.
Uitgelichte afbeelding- en videocredits: Google Deepmind