Dataconomy NL
Subscribe
No Result
View All Result
Dataconomy NL
Subscribe
No Result
View All Result
Dataconomy NL
No Result
View All Result

Uit antropisch onderzoek blijkt dat AI een beperkt zelfbewustzijn heeft van zijn eigen gedachten

byAytun Çelebi
12 november 2025
in Industrie, Onderzoek
Home Industrie
Share on FacebookShare on Twitter
Google Preferred Source

Antropisch onderzoek details van het onbetrouwbare zelfbewustzijn van Large Language Models (LLM) met betrekking tot interne processen, ondanks een aantal opgemerkte detectiemogelijkheden. Het nieuwste onderzoek van Anthropic, gedocumenteerd in “Opkomend introspectief bewustzijn in grote taalmodellen“, onderzoekt het vermogen van LLM’s om hun eigen gevolgtrekkingsprocessen te begrijpen. Dit onderzoek bouwt voort op eerder werk op het gebied van de interpreteerbaarheid van AI. De studie concludeert dat de huidige AI-modellen “zeer onbetrouwbaar” zijn in het beschrijven van hun innerlijke werking, waarbij “mislukkingen in introspectie de norm blijven.” Het onderzoek maakt gebruik van een methode die ‘conceptinjectie’ wordt genoemd. Hierbij wordt de interne activeringstoestand van een LLM na een controleprompt en een experimentele prompt vergeleken. Bijvoorbeeld het vergelijken van een ‘ALL CAPS’-prompt met dezelfde prompt in kleine letters. helpt bij het berekenen van verschillen in activeringen tussen miljarden interne neuronen. Dit identificeert een ‘vector’, die representeert hoe een concept wordt gemodelleerd in de interne toestand van de LLM. Deze conceptvectoren worden vervolgens ‘geïnjecteerd’ in het model, waardoor het gewicht van specifieke neuronale activeringen wordt vergroot om het model naar een concept te ‘sturen’. Experimenten beoordelen vervolgens of het model deze interne wijziging registreert caps” vector, zou een model kunnen zeggen: “Ik merk wat lijkt op een geïnjecteerde gedachte die verband houdt met het woord ‘LUID’ of ‘SCHREEUWEND'”, zonder directe tekstprompts om dit antwoord te begeleiden. Dit vermogen bleek echter inconsistent en kwetsbaar bij herhaalde tests. De best presterende modellen, Opus 4 en 4.1, identificeerden het geïnjecteerde concept slechts 20% van de tijd correct. In een test met de vraag: “Ervaart u iets ongewoons?”, behaalde Opus 4.1 een score van 42%. Het ‘introspectie’-effect toonde ook een hoge gevoeligheid voor de interne modellaag waar het concept werd ingevoegd. Het ‘zelfbewustzijn’-effect verdween als het concept te vroeg of te laat werd geïntroduceerd in het meerstaps-inferentieproces verontschuldigden zich en “verzonnen een verklaring waarom het geïnjecteerde concept in me opkwam.” De onderzoekers merkten op dat “de huidige taalmodellen enig functioneel introspectief bewustzijn bezitten van hun eigen interne toestanden”, met extra nadruk in hun paper ‘anomaliedetectiemechanismen’ en ‘consistentiecontrolecircuits’ die zich tijdens de training organisch zouden kunnen ontwikkelen om ‘effectief een functie van de interne representaties ervan te berekenen’, hoewel ze geen definitieve verklaring bieden. De mechanismen die aan de huidige resultaten ten grondslag liggen, kunnen ‘nogal oppervlakkig en nauw gespecialiseerd’ zijn.


Uitgelicht beeldtegoed

Tags: AntropischOnderzoek

Related Posts

De opt-outregels voor Google AI-zoekopdrachten zorgen voor de lancering van de Enviromates-browser

De opt-outregels voor Google AI-zoekopdrachten zorgen voor de lancering van de Enviromates-browser

3 juni 2026
Onderzoekers ontdekken een twintigvoudige verbetering in ultrasnelle laserexperimenten

Onderzoekers ontdekken een twintigvoudige verbetering in ultrasnelle laserexperimenten

3 juni 2026
Intel’s nieuwe Core Ultra-chips zijn naar verluidt schaars

Intel’s nieuwe Core Ultra-chips zijn naar verluidt schaars

3 juni 2026
Wauw Meta bedankt voor 30 hele minuten zonder toezicht

Wauw Meta bedankt voor 30 hele minuten zonder toezicht

3 juni 2026
Het Europees Parlement schrapt Google als standaardzoekmachine

Het Europees Parlement schrapt Google als standaardzoekmachine

3 juni 2026
Polen overweegt om telefoons voor leerlingen onder de 16 jaar op scholen te verbieden

Polen overweegt om telefoons voor leerlingen onder de 16 jaar op scholen te verbieden

3 juni 2026

Recent Posts

  • De opt-outregels voor Google AI-zoekopdrachten zorgen voor de lancering van de Enviromates-browser
  • Sony onthult God of War: Laufey voor PS5
  • Onderzoekers ontdekken een twintigvoudige verbetering in ultrasnelle laserexperimenten
  • Microsoft onthult Surface RTX Spark Dev Box voor AI-workloads
  • Intel’s nieuwe Core Ultra-chips zijn naar verluidt schaars

Recent Comments

Geen reacties om weer te geven.
Dataconomy NL

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies to improve your experience. You can choose to accept or reject them. Visit our Privacy Policy.