Ooit afgevraagd hoe je vrij gemakkelijk door een nieuwe buurt kunt navigeren of thuis een complex project kunt vinden? U beheert het waarschijnlijk zonder veel zweet te breken, uw weg te vinden of de stappen op te stellen zonder elke optie in kaart te brengen. Denk nu aan kunstmatige intelligentie. Hoewel AI specifieke spellen of crunch -nummers kan verpletteren, is het bouwen van een AI die de rommelige, gedeeltelijk bekende echte wereld navigeert zoals we doen, nog steeds een enorme uitdaging. Waarom zijn we zo goed in deze complexe planning en vinden we vaak oplossingen vinden die onmogelijk moeilijk lijken voor computers? En waarom laten laboratoriumtests ons soms zien dat we paden nemen die technisch gezien niet de absolute ‘beste’ zijn?
Deze puzzel is de sleutel tot het begrijpen van intelligentie, zowel de onze als de kunstmatige soort. Standaard AI ziet planning vaak als het verkennen van een gigantische vertakkingsboom van keuzes en resultaten. Hoe groter de boom, hoe moeilijker het probleem. Maar mensen werken duidelijk niet zo. We lijken geen perfecte, gedetailleerde blauwdruk van de wereld te dragen. Een team van onderzoekers van Dalhousie University, University of Waterloo, MIT en Cornell University heeft een fascinerend alternatief idee. Wat als onze mentale kaarten niet zoals statische foto’s zijn, maar meer op flexibele computerprogramma’s?
Marta Kryven, Cole Wyeth, Aidan Curtis en Kevin Ellis suggereren dat onze talent voor planning voortkomt uit een kerngeloof: De wereld volgt meestal voorspelbare patronen. In plaats van elk laatste detail te onthouden, bouwen we misschien mentale modellen met behulp van compacte programma’s die herhaling, symmetrie en herbruikbare brokken vastleggen. Denk aan het herkennen van de standaardindeling van kantoorvloeren of de manier waarop straten vaak roosters vormen. Dit idee van ‘concepten als programma’s’ beeldt onze hersenen af als constant op zoek naar de onderliggende code van de wereld om efficiënt te navigeren. Laten we in hun duiken studie.
Waarom blauwdrukken en brute kracht tekortschieten
Waarom is het denken aan kaarten als programma’s mogelijk een game -wisselaar? Kijk hoe typisch AI omgaat met de planning, vooral als het niet alle informatie heeft. Deze situatie wordt vaak gemodelleerd als een POMDP of gedeeltelijk waarneembaar Markov -beslissingsproces. Het vinden van de beste oplossing omvat meestal het berekenen van kansen voor elk mogelijk scenario en planning in al die onzekerheid. Deze aanpak wordt al snel overweldigend complex, zelfs voor vrij eenvoudige omgevingen. Het voelt gewoon niet op de soepele manier waarop mensen rondkomen.
Bovendien is er die rare ontkoppeling. We behandelen de gestructureerde complexiteit van het echte leven heel goed. Denk aan stadsroosters, modulaire meubels, paden in een park. Maar plaats mensen in vereenvoudigde laboratoriumtaken die zijn ontworpen zonder duidelijke structuur, en ze volgen vaak niet het wiskundige ‘optimale’ pad. Onderzoekers hebben dit tot mentale limieten gekalfd, zoals slechts een paar stappen vooruit denken. Maar Kryven en haar collega’s denken dat dat misschien het punt missen. Misschien zijn we geen gebrekkige planners. Misschien zijn we gewoon ongelooflijk goede planners specifiek voor het gestructureerde soort wereld waarin we daadwerkelijk leven. We zoeken naar patronen, en we gebruiken ze.
AI -onderzoekers hebben geprobeerd de complexiteit aan te pakken met strategieën zoals hiërarchische planning (grote problemen in het breken van kleine) of het herkennen van vergelijkbare gamestoestanden. Maar automatisch leren en het soort ‘gezond verstand’ structurele kennis gebruiken die we hebben, blijft een grote hindernis.
Ontmoet GMP: plannen als een coder
Om hun idee op de proef te stellen, bouwden de onderzoekers een computermodel met de naam Generative Modular Planning of GMP. Dit model werkt op het principe van cognitieve kaarten als programma’s. Het slaat geen exacte foto van een plek op. In plaats daarvan bedenkt het een eenvoudig programma dat zijn basisstructuur vastlegt.
GMP heeft twee hoofdonderdelen:
- De kaartgenerator (GMM): Dit deel kijkt naar een kaart, zoals een doolhof in hun experiment, en probeert het eenvoudigste programma te schrijven dat het kan herbouwen. Hier is een echt interessante wending. De onderzoekers gebruikten een groot taalmodel, GPT-4, voor deze baan. Niet voor planning, maar voor het schrijven van code. Ze hebben de LLM ertoe aangezet om herhaalde visuele patronen in het doolhof te herhalen. Vervolgens schreef de LLM Python -code die deze brokken definieerde en legde uit hoe ze ze kunnen combineren (bewegen, roteren, omdraaien) om de kaart opnieuw te maken. Het systeem geeft de voorkeur aan eenvoudige programma’s die brokken efficiënt hergebruiken. Het volgt een principe dat de meest gecomprimeerde verklaring bevordert, in wezen op zoek naar de netste code die de structuur van de kaart beschrijft.
- The Modular Planner (FP): Zodra de GMM een programmamaart maakt gemaakt van herbruikbare brokken, komt de FP -module uit hoe je je kunt verplaatsen. In plaats van een enorm, complex pad voor de hele kaart te berekenen, plant het een efficiënte route binnen elk type brok slechts eenmaal. Vervolgens, elke keer dat het weer hetzelfde type brok tegenkomt, is het eenvoudigweg Trekt zich uit en hergebruikt het plan dat het al heeft gemaakt. Dit bespaart veel rekenkracht en geheugen. Om van het ene stuk naar het andere te komen, gaat het naar het dichtstbijzijnde onontgonnen stuk, ervan uitgaande dat het doel (zoals de uitgang van de doolhof) overal zou kunnen zijn.
Deze manier van plannen is slim binnen elke module. Het vindt het beste pad binnen dat erkende stuk. Maar het verbinden van deze slimme lokale paden kan leiden tot een wereldwijde route die iets langer is dan als een planner de hele kaart perfect zou bekijken. Deze mogelijkheid van slimme, efficiënte, maar misschien enigszins indirecte routes was precies het soort mensachtige gedrag waar de onderzoekers naar letten.
Dus, plannen mensen eigenlijk zoals het GMP -model? Het team gebruikte een doolhofzoektaak om erachter te komen. Dertig deelnemers navigeerden 20 verschillende doolhoven op een computer en zagen de wereld vanuit een first-person view. Delen van het doolhof waren verborgen totdat ze dichtbij genoeg kwamen. Hun doel: vind de verborgen uitgang, gemarkeerd door een rode tegel.
Dit waren niet zomaar doolhoven. Ze zijn specifiek ontworpen met duidelijke, herhalende structuren. Ze hadden modulaire lay -outs gemaakt van verschillende stukken, zoals bepaalde kamervormen of gangsecties. Deze opstelling was perfect om te zien of mensen natuurlijk de module per module zouden verkennen, of dat ze snelkoppelingen zouden nemen die modules doorsnijden als dat wiskundig korter leek, zoals traditionele optimale planners zouden kunnen voorspellen.
Het team vergeleek de paden van mensen met drie verschillende modellen:
- GMP: Het nieuwe model, gokken op modulair zoeken op basis van die programma-achtige kaarten.
- Verwacht nut: De standaard ‘optimale’ planner, die het absolute kortste pad berekent gezien de onzekerheid.
- Hulpprogramma met korting: Een model dat de planning nabootst met een beperkte aandachtsspanne (alleen een paar stappen vooruit kijkt), wat menselijk gedrag goed had uitgelegd in ongestructureerd MACHTEN VOORDAT.
De doolhoven zijn ontworpen, zodat de traditionele modellen meestal niet-modulaire paden zouden suggereren, waardoor het gemakkelijk is om te zien welke strategie mensen de voorkeur gaven.
Wij zijn modulaire planners
De bevindingen waren vrij duidelijk. Mensen gebruikten overweldigend modulaire strategieën. Ze verkenden de gestructureerde doolhoven brok door chunk en bewogen systematisch van één herkende sectie naar de dichtstbijzijnde volgende. Dit was niet alleen een toevalstreffer; Het was het consistente patroon voor verschillende doolhofontwerpen en de meeste deelnemers.
De onderzoekers keken goed naar “discriminerende beslissingen”. Dit waren punten in het doolhof waar het GMP -model een andere beweging suggereerde dan de traditionele modellen. Op deze belangrijke momenten, GMP deed een aanzienlijk betere werk om te voorspellen wat mensen eigenlijk zouden doen. Mensen waren niet alleen willekeurig inefficiënt; Ze werden systematisch modulair. Hun gedrag stond prachtig op de hoogte van de strategie die je zou verwachten als ze programma-achtige mentale kaarten gebruikten.
Een van de echt nette delen van deze studie is hoe ze de LLM hebben gebruikt. Het nam geen beslissingen. Het gedroeg zich als een stand-in voor de mens structurele perceptie. Omdat LLM’s zijn getraind op bergen van menselijk schrijven en code, lijken ze veel voorkomende manieren te absorberen waarop mensen dingen structureren, inclusief ruimtes. Op de vraag om een programma voor het doolhof te schrijven, kwam GPT-4 met structurele storingen, de brokken en regels, die overeenkwamen hoe mensen later navigeerden.
Dit hint dat LLMS misschien nuttig kan zijn voor meer dan alleen het genereren van tekst. Ze kunnen ons mogelijk helpen de ingebouwde veronderstellingen en mentale snelkoppelingen, de ‘inductieve vooroordelen’ te begrijpen, wij mensen gebruiken om alles te begrijpen. Hier hielp het een visueel doolhof te vertalen in een nuttige, codeachtige structuur die perfect is voor efficiënte planning.
Onderzoek: een periodieke tabel voor machine learning
Veranderen hoe we denken over mentale kaarten en AI
Dit onderzoek daagt het oude idee van cognitieve kaarten uit als eenvoudige, statische foto’s in ons hoofd. Het beschouwen ervan als actief, generatieve programma’s zijn computationeel zinvol. Het verklaart hoe we omgaan met de complexe, onzekere echte wereld met beperkte hersenkracht. Het verklaart onze efficiëntie op gestructureerde plaatsen, en misschien zelfs waarom we soms paden nemen die niet wiskundig perfect zijn, maar veel gemakkelijker te achterhalen zijn en onthouden.
Voor kunstmatige intelligentie biedt dit een praktisch pad vooruit. Het GMP -model toont eerst de kracht om structuur te vinden en vervolgens modulair te plannen. AI -agenten die op deze manier zijn gebouwd, kunnen mogelijk veel efficiëntere omgevingen van complexe, deels bekende omgevingen navigeren, waardoor veel minder geheugen- en verwerkingskracht nodig is. Het wijst naar AI die meer van plan is als wij, door patronen te spotten in plaats van alleen maar mogelijkheden te kraken.
Natuurlijk zijn er nog vragen. Het huidige GMP -model maakt eenvoudige veronderstellingen over het verplaatsen tussen brokken. Toekomstig onderzoek moet onderzoeken hoe we prioriteit kunnen geven aan bepaalde gebieden op basis van ervaringen uit het verleden of de huidige doelen. Hoe passen we onze mentale programma’s aan als de wereld niet aan onze verwachtingen voldoet? Hoeveel beïnvloeden onze doelen de structuren die we waarnemen? Zelfs met deze open vragen geeft deze studie ons een krachtige nieuwe manier om na te denken over hoe we onze weg vinden.
Uiteindelijk suggereert het iets diepgaands aan ons. Ons verbazingwekkende vermogen om te navigeren en effectief te handelen in onze complexe wereld kan erop komen dat onze hersenen deskundige patroonvinders zijn, die constant de onderliggende code van de gestructureerde realiteit om ons heen ziet en het niet alleen als een scène vertegenwoordigt, maar als een programma dat klaar is om te worden uitgevoerd.