Alphaevolve: Hoe Google's nieuwe AI naar waarheid streeft met zelfcorrectie

Het AI Research and Development Lab van Google, DeepMind, heeft Alphaevolve onthuld, een AI-systeem dat is ontworpen om complexe problemen in wiskunde en wetenschap aan te pakken met “machine-gradable” oplossingen. Het systeem maakt gebruik van “state-of-the-art” -modellen, met name Gemini-modellen, om mogelijke antwoorden op een bepaald probleem te genereren, te bekritiseren en te evalueren.

Alphaevolve introduceert een mechanisme om hallucinaties in AI -modellen te verminderen met behulp van een automatisch evaluatiesysteem. Dit systeem scoort de gegenereerde antwoorden op nauwkeurigheid, waardoor het effectief kan werken aan problemen die kunnen worden geëvalueerd, met name op gebieden zoals informatica en systeemoptimalisatie.

Gebruiken Alfaevolvegebruikers moeten een probleemverklaring verstrekken, samen met optionele details zoals instructies, vergelijkingen en relevante literatuur. Ze moeten ook een mechanisme leveren voor het automatisch beoordelen van de antwoorden van het systeem, meestal in de vorm van een formule. Het vermogen van het systeem is beperkt tot het beschrijven van oplossingen als algoritmen, waardoor het minder geschikt is voor niet-numerieke problemen.

In benchmarkingtests kreeg Alphaevolve ongeveer 50 wiskundeproblemen in verschillende takken, waaronder geometrie en combinatoriek. Het systeem “herontdekte” met succes de bekendste antwoorden 75% van de tijd en ontdekte verbeterde oplossingen in 20% van de gevallen. DeepMind heeft ook alfaevolve toegepast op praktische problemen, zoals het optimaliseren van de efficiëntie van Google’s datacenter en het versnellen van modellenopleidingen.

Video: Google DeepMind

Volgens VerdiepenAlphaevolve genereerde een algoritme dat gemiddeld 0,7% van de wereldwijde rekenbronnen van Google herstelde en suggereerde een optimalisatie die de totale tijd verkortte om Gemini -modellen met 1% te trainen. Hoewel Alphaevolve geen baanbrekende ontdekkingen doet, wordt beweerd dat het tijd bespaart en experts vrijmaken om zich te concentreren op meer kritische taken.

DeepMind is van plan om een gebruikersinterface voor Alphaevolve te bouwen en een vroeg toegangsprogramma voor geselecteerde academici te starten voordat hij een bredere uitrol overweegt. Het lab beweert dat de mogelijkheden van Alphaevolve het een waardevol hulpmiddel maken voor domein -experts.

Uitgelichte afbeeldingskrediet