Jevgeni Tolstykh vroeg een AI niet zomaar om een beleefde e-mail op te stellen of een vergadering in de zijne samen te vatten recent onderzoek. Hij daagde het uit om van de grond af aan een AAA-gameproductieafdeling op te bouwen. In een rechtstreeks experiment gaf Tolstykh een Large Language Model (LLM) de opdracht om kunstroutekaarten, Jira-structuren en productieschattingen te genereren, en vervolgens de resultaten te meten aan de hand van de output van zijn menselijke team.
De bevindingen waren grimmig.
De AI heeft de planningstijdlijnen ingekort van weken naar uren, maar kwam met een voorbehoud: een gevaarlijke neiging tot ‘gehallucineerd’ optimisme. Tolstykhs experiment biedt een gedetailleerd beeld van de wrijving tussen algoritmische snelheid en de chaotische realiteit van game-ontwikkeling.
Deze verschuiving vindt niet plaats in een vacuüm. Recente gegevens uit de sector bevestigen dat Tolstykh aan de voorhoede staat van een enorme structurele draai. Volgens een Google Cloud-enquête uit 2025Integreert 90% van de game-ontwikkelaars nu generatieve AI in hun workflows, en 95% meldt dat de technologie repetitieve taken actief vermindert.
Misschien wel het meest opvallend voor producenten: 44% van de ontwikkelaars gebruikt nu AI om informatie autonoom te verwerken, waardoor snellere besluitvorming over de hele pijplijn mogelijk wordt. Deze snelle adoptie komt omdat 94% van de respondenten gelooft dat AI uiteindelijk de sleutel zal zijn tot het terugdringen van de stijgende productiekosten.
De wiskundige basislijn voor creativiteit
Een van de meest opvallende resultaten van het experiment was het voorstel van de AI voor een “BTSU” (BT-level shell unit) om de complexiteit van de kunst te standaardiseren. Terwijl Tolstykh het oorspronkelijke concept van een ‘gouden eenheid’ voor schatting leverde, formaliseerde de AI de wiskunde onafhankelijk.
“De belangrijkste bijdrage van het model was niet de opkomst van het idee zelf, maar de formalisering ervan”, zegt Tolstykh. “De AI heeft onafhankelijk de structuur van de formule afgeleid, de keuze van de parameters gerechtvaardigd en de logica ervan uitgelegd zonder aanvullende verduidelijking.”
Cruciaal was dat Tolstykh alle projectspecifieke gegevens en interne schattingen achterhield om de 'out of the box'-mogelijkheden van het model te testen en strikte NDA-beperkingen te respecteren. De AI vertrouwde op zijn interne statistische representaties van hoe complexe objecten over verschillende domeinen worden ontleed om een functionele basislijn op te bouwen.
“Ik behandelde de BTSU-formule niet als een ontdekte objectieve waarheid, maar als een hypothese gegenereerd door het model en onderworpen aan validatie en kalibratie aan de hand van echte productiegegevens”, legt hij uit.
Navigeren door de ‘optimismevalstrik’
De initiële AI-schattingen waren 1,5 keer lager dan die van het menselijke team. Zelfs nadat hij de aanwijzingen had verfijnd met referentiegegevens, handhaafde Tolstykh een onvoorziene buffer van 15%, een hoofdbestanddeel van zijn productiepraktijk. Hij beschouwt dit niet als een oplossing voor ‘AI-optimisme’, maar als een noodzakelijke bescherming tegen de inherente chaos van live-ontwikkeling.
Tolstykh stelt echter dat het ‘clean room’-perspectief van de AI zijn eigen waarde heeft. “Een schoon, laboratoriumachtig perspectief vanuit een vacuüm kan een interessante lens zijn om je processen van buitenaf te bekijken”, zegt hij. Het dwingt producenten zich af te vragen hoe een project eruit zou kunnen zien als de onvermijdelijke fricties in de echte wereld zouden worden weggenomen.
Het menselijke element in een agentische toekomst
Terwijl Tolstykh zich voorbereidt op het verkennen van ‘Agentic AI’ – systemen die zijn ontworpen om met meer autonomie te handelen – erkent hij de existentiële angst die veel projectmanagers voelen. Toch benadrukt hij dat de kern van de producentenrol veilig blijft voor automatisering.
“AI is niet in staat mensen te vervangen in wat het belangrijkst is: het nemen van beslissingen en het nemen van verantwoordelijkheid onder onzekerheid”, zegt Tolstykh. “Conflictmanagement, communicatie met belanghebbenden en het balanceren van kwaliteit, deadlines en teammoraal omvatten niet alleen analyse, maar ook vertrouwen, context en persoonlijke relaties die in de loop van de tijd zijn opgebouwd.”
Hij vergelijkt de toekomst van de productie met de luchtvaart. Automatische piloten bestaan al tientallen jaren, maar de gezagvoerder bestuurt nog steeds het vliegtuig. “Agentic AI kan een sterke assistent worden bij het plannen en voorspellen, maar de uiteindelijke beslissing, vooral als de inzet hoog is en er niet één juist antwoord is, is nog steeds de zaak van een mens”, voegt hij eraan toe.
Wanneer hallucinatie innovatie wordt
De AI kwam af en toe met ongevraagde suggesties, zoals een 'Titan Armor Production Template', die het team van Tolstykh uiteindelijk valideerde als een solide strategie. Dit roept een moeilijke vraag op: hoe onderscheid je een ‘slechte gok’ van een ‘briljante hypothese’?
“Als een AI-suggestie niet in een echte pijplijn past, in de praktijk geen stand houdt of geen duidelijke interne logica heeft, dan is het een slechte gok”, legt Tolstykh uit. Hij begeleidt junior producenten om zich te concentreren op verificatie in plaats van op blind vertrouwen. “Onze belangrijkste superkracht is het controleren van feiten; we moeten alles verifiëren wat er wordt gezegd.”
Wil een ‘hallucinatie’ een kenmerk worden, dan moet deze begrijpelijk en testbaar zijn. Volgens Tolstykh is AI het nuttigst als het regelmatig hypothesen biedt die veilig kunnen worden getest en verworpen zonder het systeem te breken.
De psychologische veiligheid van eenvoudige hulpmiddelen
Terwijl de industrie vaak jacht maakt op dure AI-suites op ondernemingsniveau, pleit Tolstykh voor het gebruik van de eenvoudigste LLM's voor consumenten. Hij vindt dat deze toegankelijke hulpmiddelen de toegangsdrempel voor sceptische veteranen verlagen.
“Met eenvoudige, toegankelijke tools kunnen mensen experimenteren zonder risico te lopen of de controle te verliezen”, zegt Tolstykh. “De focus verschuift van 'Moeten we dit implementeren?' tot 'Hoe kan dit mij helpen bij mijn specifieke taak?'”
Door de ‘top-down’-druk van complexe integraties weg te nemen, voelen deze tools psychologisch veiliger aan. Voor de ervaren ontwikkelaar is een tool die stilletjes helpt bij concrete taken veel gemakkelijker te accepteren dan een tool die een revolutie belooft.





