Stedelijke verandering sluipt meestal op ons. Een nieuw café hier. Een geschilderd viaduct daar. Maar wat als je een heel decennium van de visuele transformatie van een stad zou kunnen zien, automatisch vastgelegd, gesorteerd en uitgelegd door AI?
Dat is precies wat een nieuw onderzoeksproject noemde Visuele kronieken op weg om te doen. Ontwikkeld door onderzoekers Van Stanford en Google DeepMind gebruikte dit systeem multimodale grote taalmodellen (MLLMS) om meer dan 40 miljoen Google Street View -afbeeldingen uit New York City en San Francisco te analyseren. Het zag trends die mensen niet gemakkelijk zouden opmerken.
Het onmogelijke probleem van schaal
Het volgen van kleine veranderingen in de loop van de tijd is niets nieuws in computer vision. Maar het meeste eerdere werk had labels nodig of gericht op specifieke dingen zoals auto’s of gezichten. Dit project was anders. Het doel was open: wat veranderde het vaakst in deze steden, meer dan tien jaar?
Eenvoudige vraag. Brutaal hard in de praktijk.
Grote taalmodellen zijn goed in redeneren over afbeeldingen, maar ze worstelen wanneer de dataset verder gaat dan een paar duizend afbeeldingen. Visual Chronicles had te maken met miljoenen. Dus de onderzoekers hebben een bottom-up strategie ontworpen. Detecteer eerst kleine lokale veranderingen zoals een nieuw bord of een verwijderde boom. Cluster ze vervolgens in bredere stadsbrede trends.
AI’s detective werkt op straat
Hier is hoe het in actie werkte:
- Stap 1: Vergelijk afbeeldingen van dezelfde locatie in de loop van de tijd.
- Stap 2: Vraag de AI om te beschrijven wat er is veranderd, met bewijs uit de afbeeldingen.
- Stap 3: Groep soortgelijke veranderingen in de stad.
- Stap 4: Controleer die trends met verdere AI -controles.
Deze hybride benadering liet het systeem subtiele veranderingen detecteren. Outdoor Dining Setups na Covid-19. Nieuwe zonnepanelen op daken. Allemaal gespot zonder te verdrinken in gegevens of het genereren van abstracte antwoorden zoals ‘economische groei’.
Dus wat heeft het gevonden?
In New York City zag de AI een dramatische opkomst in:
- Beveiligingscamera’s: 745 nieuwe installaties in wijken.
- Hekken rond parkeerplaatsen: 509 nieuwe toevoegingen.
- Sidewalk -upgrades: 519 Nieuwe Red ADA -waarschuwingsblokken.
In San Francisco zagen de kenmerkende trends van het decennium er anders uit:
- Zonnepanelen: 1504 nieuwe installaties op het dak, vooral zichtbaar van verhoogde snelwegen.
- Toegewijde busbanen: 751 nieuwe rijstrookconversies voor openbaar vervoer.
- Fietsrekken: 1799 Nieuwe rekken, meestal in de buurt van het centrum.
De covid -jaren lieten overal visuele vingerafdrukken achter
De onderzoekers concentreerden zich ook op de pandemische periode en legden vast hoe stadsstraten zich na 2020 aangepast.
En toen was er het blauwe viaduct. Een snelweggedeelte in San Francisco werd ‘Coronado Blue’ geschilderd, een detail dat na 2020 481 keer werd gespot in straatweergave.
In New York werd het systeem ook gebruikt om veranderingen in de winkel te volgen. Het onthulde twee tegengestelde trends:
- Openingen van bakkerijen en sapwinkels in gentrifying -gebieden.
- Sluitingen van supermarkten en banktakken in oudere winkelzones.
Omdat waarom niet. Onderzoekers voerden een laatste experiment uit en vroegen de AI om naar willekeurige afbeeldingen te kijken en ‘ongebruikelijke dingen’ te vinden.
De winnaar? Gigantische abstracte sculpturen verspreid over New York City. Meer dan 200 instanties van openbare kunstinstallaties, allemaal gegroepeerd door het model.
Vertrouwen AI -modellen hun toezichthouders?
Waarom dit er veel toe is dan het overzicht van de straat
Visual Chronicles laat zien hoe toekomstige AI -tools bedrijven, overheden of onderzoekers kunnen laten volgen in elke grote visuele dataset. Satellietbeelden. Fabrieksvloeren. Elke plaats die in de loop van de tijd verandert.
Het is ook een waarschuwing. AI ‘ziet’ niet alleen afbeeldingen. Het verklaart hen terug naar ons op manieren die vormgeven aan wat we geloven dat er gebeurt. Hoe meer we deze geautomatiseerde trendrapporten vertrouwen, hoe meer we systemen nodig hebben die de snelheid van AI in balans hebben met de menselijke voorzichtigheid.
Visual Chronicles is een vroeg voorbeeld van dat soort systeem. Het is precies genoeg om echte patronen te vinden, schaalbaar genoeg om miljoenen afbeeldingen aan te kunnen, en gegrond genoeg om de verhalen te laten ondersteund door bewijsmateriaal.