AI-overdrachtsleren versnelt kosmologisch onderzoek, maar brengt verborgen risico's met zich mee

Nieuw onderzoek wijst uit dat transfer learning de zoektocht naar nieuwe natuurkunde aanzienlijk kan versnellen, waardoor de behoefte aan dure simulaties kan worden verminderd. De afhankelijkheid van gevestigde patronen kan er echter voor zorgen dat AI werkelijk nieuwe fenomenen over het hoofd ziet, blijkt uit een studie gepubliceerd in de Journal of Cosmology and Astroarticle Physics (JCAP).

Het standaardmodel van de kosmologie, bekend als ΛCDM, verklaart veel kenmerken van het universum, maar is niet alomvattend. Nieuwe waarnemingen hebben vragen opgeroepen over concepten als massieve neutrino’s, gewijzigde zwaartekracht en evoluerende donkere energie. Om deze te onderzoeken zijn uitgebreide computersimulaties nodig, die zowel rekentechnisch duur als tijdrovend zijn.

Het onderzoeksteam wilde bepalen of transferleren de simulatie-efficiëntie zou kunnen verbeteren. Met transfer learning kan een AI kennis van eenvoudigere taken toepassen op meer complexe taken, waardoor de kosten worden verlaagd. Aanvankelijk werd de AI getraind in elementaire ΛCDM-simulaties voordat hij overging op complexere modellen waarin potentiële nieuwe natuurkunde werd geïntegreerd.

Adrian Bayer, co-auteur van het Flatiron Institute en Princeton University, beschreef deze methode als een kortere weg naar traditionele AI-training. “Gewoonlijk trainen mensen de AI rechtstreeks op de rekentechnisch duurste simulaties. Wat we in plaats daarvan doen is eerst eenvoudigere en goedkopere ΛCDM-simulaties gebruiken om de AI een idee te geven van wat er gebeurt”, aldus Bayer.

Deze pretrainingstrategie hielp de AI de complexiteit te beheersen zonder overweldigd te worden. Uit het onderzoek bleek dat transfer learning het aantal dure simulaties dat nodig was in sommige gevallen met meer dan een factor tien verminderde.

De onderzoekers identificeerden ook een uitdaging die bekend staat als negatieve overdracht, die optreedt wanneer AI nieuwe informatie verkeerd interpreteert op basis van reeds bestaande kennis. De AI had vaak moeite om nieuwe effecten te onderscheiden als deze leken op patronen die waren afgestemd op bestaande ΛCDM-parameters. Dit was duidelijk zichtbaar in simulaties met enorme neutrino’s, waarbij de AI moeite had om nieuwe signaturen te onderscheiden van de handtekeningen die het al aan bekende parameters had gekoppeld.

Veena Krishnaraj, de hoofdauteur van het onderzoek, legde uit dat de negatieve overdracht het gevolg is van onderliggende fysieke degeneraties in de modellen. “Verschillende fysieke processen kunnen zeer vergelijkbare waarneembare kenmerken produceren”, merkte ze op, waarmee ze de noodzaak van voorzichtigheid bij het interpreteren van AI-bevindingen aangaf.

De studie benadrukt zowel de potentiële voordelen als de beperkingen van transferleren in het natuurkundedomein. Hoewel voortraining de data-analyse kan versnellen, kan dit het vermogen van de AI om baanbrekende ontdekkingen te herkennen belemmeren. De volgende fase omvat het toepassen van de transfer learning-techniek op echte astronomische waarnemingen.

De onderzoekers verwachten dat transfer learning cruciaal zal zijn voor komende kosmologische onderzoeken die zeer nauwkeurige gegevens zullen verzamelen. Het artikel met de titel “Transfer Learning Beyond the Standard Model”, geschreven door Veena Krishnaraj en collega’s, is nu gepubliceerd in JSTAT.

Aanbevolen afbeeldingscredits