Het Allen Institute for AI (Ai2) heeft Molmo openbaar gemaakt, een innovatieve set open-source multimodale modellen die de sturende invloed van propriëtaire AI-systemen betwisten. Met sterke punten in superieure beeldherkenning en bruikbare inzichten is Molmo klaar om ontwikkelaars, onderzoekers en startups te helpen door een geavanceerde maar gebruiksvriendelijke AI-applicatieontwikkelingstool te leveren. De lancering vestigt de aandacht op een belangrijke verandering in het AI-landschap, door open-source en propriëtaire modellen te verenigen en ieders toegang tot toonaangevende AI-technologie te verbeteren.
Molmo biedt functies die een uitzonderlijke mate van beeldbegrip bieden, waardoor het een breed scala aan visuele gegevens correct kan lezen, van alledaagse items tot complexe grafieken en menu’s. In plaats van te zijn zoals de meeste AI-modellenMolmo overtreft perceptie door gebruikers in staat te stellen om te interacteren met virtuele en echte omgevingen door middel van aanwijzen en een reeks ruimtelijke acties. Deze mogelijkheid duidt op een doorbraak, die de introductie mogelijk maakt van complexe AI-agenten, robotica en vele andere toepassingen die afhankelijk zijn van een gedetailleerd begrip van zowel visuele als contextuele gegevens.
Efficiëntie en toegankelijkheid zijn belangrijke aspecten van de Molmo-ontwikkelingsstrategie. De geavanceerde vaardigheden van Molmo komen voort uit een dataset van minder dan een miljoen afbeeldingen, in schril contrast met de miljarden afbeeldingen die worden verwerkt door andere modellen zoals GPT-4V en Google’s TweelingDe geïmplementeerde aanpak heeft ertoe bijgedragen dat Molmo niet alleen zeer efficiënt is in het gebruik van rekenkracht, maar ook een model heeft gecreëerd dat net zo krachtig is als de meest effectieve bedrijfseigen systemen en dat minder hallucinaties en snellere trainingssnelheden heeft.
Molmo volledig open-source maken is onderdeel van Ai2’s grotere strategische inspanning om AI-ontwikkeling te democratiseren. Ai2 stelt een divers scala aan gebruikers, van startups tot academische laboratoria, in staat om te innoveren en vooruitgang te boeken in AI-technologie zonder de hoge investeringskosten of enorme rekenkracht. Het geeft hen toegang tot Molmo’s taal- en visietrainingsgegevens, modelgewichten en broncode.
Matt Deitke, onderzoeker bij het Allen Institute for AI, vertelde “Molmo is een ongelooflijk AI-model met uitzonderlijk visueel begrip, dat de grenzen van AI-ontwikkeling verlegt door een paradigma te introduceren voor AI om te communiceren met de wereld door te wijzen. De prestaties van het model worden aangestuurd door een opmerkelijk hoogwaardige gecureerde dataset om AI te leren afbeeldingen te begrijpen via tekst. De training is zoveel sneller, goedkoper en eenvoudiger dan wat er vandaag de dag wordt gedaan, zodat de open release van hoe het is gebouwd de hele AI-community, van startups tot academische laboratoria, in staat zal stellen om aan de grens van AI-ontwikkeling te werken”.
Volgens interne evaluaties overtrof Molmo’s grootste model, met 72 miljard parameters, OpenAI’s GPT-4V en andere toonaangevende concurrenten op verschillende benchmarks. Het kleinste Molmo-model, met slechts één miljard parameters, is groot genoeg om te functioneren op een mobiel apparaat en presteert beter dan modellen met tien keer zoveel parameters. Hier je kunt de modellen zien en probeer het zelf.