Dataconomy NL
Social icon element need JNews Essential plugin to be activated.
Subscribe
No Result
View All Result
Dataconomy NL
Social icon element need JNews Essential plugin to be activated.
Subscribe
No Result
View All Result
Dataconomy NL
No Result
View All Result

Apple Research Paper onthult matrix3d ​​voor het genereren van 3D -inhoud

byAytun Çelebi
14 mei 2025
in Research
Home Research

Fotogrammetrie is al lang een nietje in de reconstructie van 3D -scènes, maar de traditionele pijplijn, dichte beeldvereisten, losgekoppelde verwerkingsfasen en cumulatieve fouten, is een koppig knelpunt geweest. Apple’s nieuwe matrix3d ​​-modelgedetailleerd in een recent uitgebracht onderzoekspaperpresenteert een uniform framework dat is ontworpen om die barrières te verwijderen door meerdere fotogrammetrie -taken te integreren in een enkel, generatief systeem.

In tegenstelling tot traditionele fotogrammetrieworkflows, die afhankelijk zijn van afzonderlijke tools voor pose -schatting, diepte -voorspelling en nieuwe weergavesynthese, behandelt Matrix3D al deze functies binnen één model. Deze verschuiving is meer dan een technische consolidatie. Het vertegenwoordigt een filosofische evolutie in de richting van aanpasbare, end-to-end systemen die in staat zijn om 3D-reconstructie aan te pakken met minimale input, Soms zelfs uit een enkele afbeelding.

Een alles-in-één benadering van fotogrammetrie

Matrix3d ​​is gebouwd op een multimodale diffusietransformator (Dit) architectuur. Dit betekent dat het niet alleen leert van RGB -afbeeldingen, maar ook van dieptekaarten en cameraposes, allemaal gecodeerd in een uniforme 2D -weergave. Het converteert bijvoorbeeld 3D -geometrie in 2.5D dieptekaarten en vertegenwoordigt camera -informatie met behulp van Plücker Ray -kaarten. Dit ontwerp stelt het in staat om technieken toe te passen van moderne generatieve beeldmodellen tot multi-view 3D-generatie.

Het model werkt door te leren ontbrekende modaliteiten te voorspellen uit gemaskerde ingangen. Tijdens de training wordt Matrix3D blootgesteld aan gedeeltelijk complete datasets-sommige met alleen afbeeldingsparenparen, andere met beelddiepte-paren. De maskeerstrategie breidt de bruikbare trainingspool aanzienlijk uit en leert het model om te generaliseren over invoerconfiguraties. Door de afhankelijkheid van volledige datasets te verwijderen, verbetert het ook de robuustheid van het model in praktische, real-world applicaties.

Apple Research Paper onthult matrix3d ​​voor het genereren van 3D -inhoud
((Afbeelding krediet))

Prestaties tussen taken

Apple’s onderzoekers benchmark matrix3d ​​over meerdere datasets, inclusief CO3D, DTU en GSO. Voor schatting van de pose onder schaarse inputomstandigheden, presteerde Matrix3D beter dan state-of-the-art modellen zoals Raydiffusion en Dust3R. Het vermogen om de camera -poses uit slechts twee of drie afbeeldingen te schatten, bleek superieur in zowel rotatie- als vertaalnauwkeurigheid.

In de synthese van New View heeft het model competitieve PSNR- en SSIM -scores behaald op verschillende cameraconfiguraties. Wanneer getest tegen toonaangevende systemen zoals Syncdreamer,, Wonder3dEn Zero123xl,, Matrix3D leverde consequent hogere fidelity resultaten op. De toevoeging van diepte -kaarten verbeterde deze statistieken verder en presenteerde de sterkte van zijn hybride modaliteitsbehandeling.

Voor diepteschatting bewees Matrix3D zijn aanpassingsvermogen opnieuw. Hoewel het model op meerdere weergaven werd getraind, presteerde het goed in monoculaire taken, waardoor gespecialiseerde dieptemodellen zoals metric3d v2 en diepte alles v2 overtroffen. Dit was vooral duidelijk in complexe scènes uit de DTU -gegevensset, waarbij Matrix3D lagere relatieve fout en rootgemiddelde vierkante afwijkingsscores produceerde.

Apple Research Paper onthult matrix3d ​​voor het genereren van 3D -inhoud
((Afbeelding krediet))

Een van de opvallende functies van Matrix3d ​​is het Mogelijkheid om 3D -geometrie te reconstrueren van extreem beperkte inputs. Het model kan beginnen met een enkele afbeelding, schatting van ontbrekende cameraposes en dieptekaarten en synthetiseren extra weergaven die nodig zijn om een ​​3D Gaussian Splatting (3DGS) -pijplijn te initialiseren. Deze stappen vereisten eerder afzonderlijke tools of uitgebreide invoergegevens. Nu kunnen ze worden uitgevoerd in een uniform kader dat het gehele wederopbouwproces vereenvoudigt.

Met Matrix3D worden zelfs ongeschonden schaarse beeldsets levensvatbaar voor 3D -reconstructie. Het model schat autonoom, vormt zich, vult ontbrekende weergaven in en bereidt de input voor voor het weergeven van motoren. De resultaten ervan werden gevalideerd tegen benchmarks en visuele vergelijkingen, met veelbelovende nauwkeurigheid ondanks het werken met minder middelen dan concurrerende methoden. Matrix3D levert vergelijkbare resultaten aan multi-GPU-systemen zoals CAT3D terwijl ze efficiënt worden uitgevoerd op een enkele GPU.

Apple Research Paper onthult matrix3d ​​voor het genereren van 3D -inhoud
((Afbeelding krediet))

Bij hybride taken is Matrix3D uniek gepositioneerd. Het kan willekeurige combinaties van RGB-, pose- en diepte -ingangen innemen en de overeenkomstige uitgangen genereren zonder omscholing of architecturale veranderingen nodig te hebben. Deze mogelijkheid opent deuren voor een bredere toepassing in interactief 3D-ontwerp, AR/VR-inhoudsgeneratie en realtime scanning van de omgeving.

  • KwantitatiefMatrix3D stelt nieuwe benchmarks in verschillende fotogrammetrietaken in. In de schatting van de pose bereikt het meer dan 96 procent relatieve rotatienauwkeurigheid met slechts twee weergaven. Voor een nieuwe weergave -synthese levert het superieure SSIM- en PSNR -scores op meerdere configuraties. In die diepgaande voorspelling registreert het lagere absolute relatieve fouten en hogere inlier -verhoudingen in vergelijking met gespecialiseerde basislijnen.
  • Kwalitatiefde verbeteringen zijn even opvallend. Visuele uitgangen tonen scherper geometrie, minder artefacten en betere consistentie tussen gezichtspunten. In vergelijking met eerdere modellen levert Matrix3D stabiele renderings, zelfs onder moeilijke invoerbeperkingen. Dit versterkt het nut van uniforme, op diffusie gebaseerde fotogrammetrie-pijpleidingen als de volgende grens in 3D-generatie.

Uitgelichte afbeeldingskrediet

Tags: AppelMatrix3d

Recent Posts

  • Klaar voor een chatgpt dat je echt kent?
  • AI -onderzoekstools kunnen meer problemen veroorzaken dan ze oplossen
  • Maakt uw super nuttige generatieve AI -partner stiekem uw baan saai?
  • Microsoft’s Adele wil uw AI een cognitief profiel geven
  • Apple Research Paper onthult matrix3d ​​voor het genereren van 3D -inhoud

Recent Comments

Geen reacties om weer te geven.
Dataconomy NL

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Follow Us

Social icon element need JNews Essential plugin to be activated.
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.