Je zou denken dat het voorspellen van dementie sterftecijfers of het in kaart brengen van stadslawaai teams van experts, grondonderzoeken en satellietbeeldvormingsbedrijven vereisen. Maar een nieuw AI -model – ontwikkeld door onderzoekers Aan de Universiteit van Beijing Jiaotong en de Universiteit van Montreal – kan het allemaal tegelijk doen, gewoon door te kijken naar kaarten, tweets en afbeeldingen. Het systeem wordt genoemd Omnigeoen als het onderzoek zijn belofte waarmaakt, kan het opnieuw definiëren hoe we steden, rampen en menselijke omgevingen in realtime lezen.
Waarom het decoderen van geospatiale gegevens zo moeilijk is
Geoai – Short voor geospatiale kunstmatige intelligentie – is altijd een lastig spel geweest. Denk er zo aan: het is alsof je een stad probeert te begrijpen door vijf talen tegelijk te lezen. Je hebt satellietbeelden, foto’s op straatniveau, statistieken van de volksgezondheid, tweets vol jargon en hashtags en locatiegegevens van duizenden vastgezette plaatsen. Elk van deze gegevenstypen spreekt een ander dialect – en de meeste AI -systemen tegenwoordig zijn slechts vloeiend in één of twee.
Bestaande modellen zijn misschien goed in het classificeren van externe detectieafbeeldingen of tagging -locaties in tekst, maar wanneer u al deze taken in één pot gooit, vallen de dingen uit elkaar. Dat is waar Omnigeo binnenkomt: het is een enkel AI -systeem dat is opgeleid om ze allemaal aan te kunnen.
Het team achter Omnigeo heeft een ontworpen Multimodaal groot taalmodel (MLLM)—Een soort AI die satellietbeelden, geospatiale metadata en natuurlijke taal in één keer kan interpreteren. Het is gebaseerd op open-source modellen zoals Llava en Qwen2, maar het is verfijnd voor vijf kerndomeinen: gezondheidsgeografie, stedelijke geografie, teledetectie op afstand, stedelijke perceptie en geospatiale semantiek.
In plaats van één model voor elke taak te bouwen, behandelt Omnigeo ze allemaal tegelijkertijd. Het geheim? Op instructies gebaseerd leren gecombineerd met wat de onderzoekers ‘multimodale verfijning’ noemen. In eenvoudige bewoordingen leert het van beeld-caption-paren, tijdreeksgegevens, ruimtelijke vectoren en meer-allemaal afgestemd op dezelfde locaties.
Laten we het hebben over echte toepassingen
Hier worden de dingen interessant. Omnigeo is getraind om:
- Voorspelling van dementie-gerelateerde sterftecijfers op provinciaal niveau met behulp van historische gegevens en satellietbeelden.
- Detecteer de primaire functie van stedelijke buurten-zoals of een gebied wordt gedomineerd door scholen of commerciële kantoren-gebaseerd op gegevens op straatniveau en POI (punt van belang).
- Beoordeel hoe “luidruchtig” of “levendig” een straat is, puur gebaseerd op afbeeldingen en bijbehorende bijschriften.
- PARSE LOCATIE BESCHRIJVINGEN IN TWEETS Tijdens natuurrampen – zoals het extraheren van “21719 Grand Hollow Lane, Katy, TX” uit een overstromingsreddingsverzoek.
Alleen al die laatste use case is voldoende om te wijzen op het potentieel van dit model in noodhulp en smart city management.
Hoe Omnigeo de wereld ziet
Technisch gezien werkt Omnigeo door geografische gegevens om te zetten in leesbare verhalen. Satellietbeelden worden bijvoorbeeld omgezet in bijschriften van natuurlijke taal (“Groene gebieden met schaarse industriële zones”), vervolgens afgestemd op gestructureerde gegevens zoals sterftecijfers of POI -distributies. Dit alles is verpakt in een instructie -gegevensset, waardoor het model in context kan leren, zoals een mens zou doen.
Het is niet alleen theoretisch. Omnigeo presteerde beter dan GPT-4O en andere toonaangevende modellen in belangrijke geospatiale taken, inclusief scèneclassificatie,, LocatieherkenningEn Voorspelling van de stedelijke functie. In sommige gevallen verlaagde het foutenpercentages met meer dan de helft. Zelfs in subjectieve gebieden zoals stedelijke perceptie – hoe “mooi” of “deprimerend” een straat eruit ziet – bleek het indrukwekkend nauwkeurig.
Waarom nu?
Steden worden moeilijker te beheren en gemakkelijker te onderzoeken. Met klimaatgebeurtenissen, populatiebieken en crises voor de volksgezondheid die allemaal tegelijk raken, hebben beleidsmakers snellere hulpmiddelen nodig om geospatiale chaos te interpreteren. Omnigeo komt aan op een moment dat AI eindelijk in staat is om hoogdimensionale gegevens over formaten te absorberen.
Het verschil? De meeste grote modellen praten tegenwoordig gewoon. Omnigeo ziet, hoort en begrijpt ruimte.
Omnigeo is een blauwdruk voor hoe toekomstige geospatiale AI eruit zou kunnen zien: een systeem dat is getraind in modaliteiten, afgestemd op echte inputs en klaar om te generaliseren.
Als chatgpt uw taalassistent is, Omnigeo is misschien het volgende brein van uw stad-Visuele chaos en locatie rommel in realtime, bruikbaar inzicht.
En het doet het allemaal zonder ooit buiten te stappen.
Uitgelichte afbeeldingskrediet: Kerem gülen/midjourney