In wat velen het ‘Jaar van de belichaamde AI’ noemen, heeft Meta dat gedaan een grote stap gezet bij het bevorderen van robotcapaciteiten via een reeks nieuwe technologieën. Meta’s Fundamental AI Research (FAIR)-divisie heeft onlangs drie onderzoeksartefacten geïntroduceerd: Meta Sparsh, Meta Digit 360 en Meta Digit Plexus, die elk vooruitgang bieden op het gebied van tastperceptie, behendigheid en samenwerking tussen mens en robot.
Wat is belichaamde AI en waarom is het belangrijk?
Embody AI verwijst naar kunstmatige-intelligentiesystemen die zijn ontworpen om te bestaan en te functioneren in de fysieke wereld, waarbij ze hun omgeving begrijpen en ermee interacteren op een manier die menselijke perceptie en acties nabootst. Traditionele AI-systemen blinken uit in data-analyse, maar schieten tekort als ze worden toegepast op fysieke taken, waarvoor niet alleen visie nodig is, maar ook sensorische feedback zoals aanraking. Door belichaamde AI te bouwen, willen onderzoekers robots creëren die kunnen waarnemen, reageren en zich zelfs kunnen aanpassen aan hun omgeving, waardoor de kloof tussen digitale intelligentie en functionaliteit in de echte wereld wordt overbrugd.
Meta’s innovaties op het gebied van belichaamde AI zijn gericht op het bereiken van wat hoofd AI-wetenschapper Yann LeCun Advanced Machine Intelligence (AMI) noemt. Dit concept voorziet machines die in staat zijn te redeneren over oorzaak en gevolg, acties te plannen en zich aan te passen aan veranderingen in hun omgeving, waardoor ze van louter hulpmiddelen overgaan naar samenwerkende assistenten.
Wat is Meta-AI vandaag de dag?
Meta’s doorbraken in belichaamde AI: Sparsh, Digit 360 en Digit Plexus
De recente aankondigingen van Meta onderstrepen haar inzet om de beperkingen van de huidige roboticatechnologie aan te pakken. Laten we de mogelijkheden van elk nieuw hulpmiddel onderzoeken.
Meta Sparsh: de basis van tactiele detectie
Meta Sparsh, wat ‘aanraking’ betekent in het Sanskriet, is een uniek, op visie gebaseerd tactiel detectiemodel waarmee robots oppervlakken en objecten kunnen ‘voelen’. Sparsh is een encoder voor algemene doeleinden die vertrouwt op een database van meer dan 460.000 tactiele beelden om robots te leren aanraking te herkennen en te interpreteren. In tegenstelling tot traditionele modellen die taakspecifieke training vereisen, maakt Sparsh gebruik van zelfgecontroleerd leren, waardoor het zich kan aanpassen aan verschillende taken en sensoren zonder dat er uitgebreide gelabelde gegevens nodig zijn.
Dit vermogen om te generaliseren is van cruciaal belang voor robots die een breed scala aan taken moeten uitvoeren. Sparsh werkt met diverse tactiele sensoren en integreert naadloos in verschillende robotconfiguraties. Door robots in staat te stellen aanraking waar te nemen, opent Sparsh kansen op gebieden waar behendige manipulatie en tactiele feedback van cruciaal belang zijn, zoals in medische toepassingen, robotchirurgie en precisieproductie.
Meta Digit 360: tactiele detectie op menselijk niveau in robotica
Digit 360 is Meta’s nieuwe tactiele vingertopsensor, ontworpen om menselijke aanraking na te bootsen. Uitgerust met 18 verschillende detectiefuncties, biedt Digit 360 zeer gedetailleerde tactiele gegevens die minieme veranderingen in het oppervlak, de kracht en de textuur van een object kunnen vastleggen. Digit 360 is gebouwd met meer dan 8 miljoen ‘taxels’ (tactiele pixels) en stelt robots in staat krachten te detecteren die zo subtiel zijn als 1 millinewton, waardoor hun vermogen om complexe, genuanceerde taken uit te voeren wordt vergroot.
Deze doorbraak in tactiele detectie heeft praktische toepassingen op verschillende gebieden. In de gezondheidszorg zou Digit 360 kunnen worden gebruikt in protheses om patiënten een verhoogd tastgevoel te geven. In virtual reality zou het meeslepende ervaringen kunnen verbeteren door gebruikers in staat te stellen objecten in digitale omgevingen te ‘voelen’. Meta werkt samen met GelSight Inc om Digit 360 op de markt te brengen, met als doel het volgend jaar toegankelijk te maken voor de bredere onderzoeksgemeenschap.
Meta Digit Plexus: een platform voor robothanden met aanraakbediening
Meta’s derde grote release, Digit Plexus, is een gestandaardiseerd hardware-softwareplatform dat is ontworpen om verschillende tactiele sensoren in één robothand te integreren. Digit Plexus combineert vingertop- en handpalmsensoren, waardoor robots een meer gecoördineerd, mensachtig aanraakreactiesysteem krijgen. Dankzij deze integratie kunnen robots sensorische feedback verwerken en realtime aanpassingen maken tijdens taken, vergelijkbaar met hoe menselijke handen werken.
Door de aanraakfeedback over de robothand te standaardiseren, verbetert Digit Plexus de controle en precisie. Meta voorziet toepassingen voor dit platform op gebieden als productie en onderhoud op afstand, waar delicate omgang met materialen essentieel is. Om een open-source roboticagemeenschap te helpen opbouwen, stelt Meta de software- en hardwareontwerpen voor Digit Plexus gratis beschikbaar.
Meta’s partnerschappen met GelSight Inc en Wonik Robotics
Naast deze technologische vooruitgang is Meta partnerschappen aangegaan om de adoptie van tactiele detectie in robotica te versnellen. In samenwerking met GelSight Inc en Wonik Robotics wil Meta zijn innovaties naar onderzoekers en ontwikkelaars over de hele wereld brengen. GelSight Inc zal de distributie van Digit 360 verzorgen, terwijl Wonik Robotics de Allegro Hand zal produceren – een robothand geïntegreerd met Digit Plexus – die naar verwachting volgend jaar zal worden gelanceerd.
Deze partnerschappen zijn belangrijk omdat ze een verschuiving vertegenwoordigen in de richting van het democratiseren van robottechnologie. Door deze geavanceerde tactiele systemen breed beschikbaar te maken, bevordert Meta een collaboratief ecosysteem dat nieuwe toepassingen zou kunnen opleveren en de prestaties van robots in alle sectoren zou kunnen verbeteren.
PARTNR: Een nieuwe maatstaf voor samenwerking tussen mens en robot
Meta introduceert ook PARTNR (Planning And Reasoning Tasks in human-Robot Collaboration), een benchmark die is ontworpen om AI-modellen te evalueren op het gebied van mens-robot-interacties in huishoudelijke omgevingen. PARTNR is gebouwd op de Habitat 3.0-simulator en biedt een realistische omgeving waarin robots met mensen kunnen communiceren via complexe taken, variërend van huishoudelijke taken tot navigatie in de fysieke wereld.
Met meer dan 100.000 op taal gebaseerde taken biedt PARTNR een gestandaardiseerde manier om de effectiviteit van AI-systemen in samenwerkingsscenario’s te testen. Deze benchmark is bedoeld om onderzoek te stimuleren naar robots die fungeren als ‘partners’ in plaats van louter als gereedschap, en hen uitrusten met het vermogen om beslissingen te nemen, te anticiperen op menselijke behoeften en hulp te bieden in alledaagse situaties.
Afbeeldingscredits: Meta