Microsoft heeft geïntroduceerd een nieuw multi-agent kunstmatige intelligentie (AI) -systeem genaamd Magnetic-One, ontworpen om complexe taken uit te voeren met behulp van meerdere gespecialiseerde agenten. Dit systeem is beschikbaar als open-sourcetool op Microsoft AutoGen en is bedoeld om ontwikkelaars en onderzoekers te helpen bij het maken van applicaties die autonoom taken uit meerdere stappen in verschillende domeinen kunnen beheren.
Wat is Magnetic-One?
Magnetic-One is een generalistisch multi-agentsysteem dat een orkestrator gebruikt om verschillende agenten te coördineren, die elk gespecialiseerd zijn in een bepaalde taak. De hoofdagent, de Orchestrator genaamd, werkt samen met vier gespecialiseerde agenten:
- WebSurfer-agent: Verwerkt surfen op het web, klikken en samenvatting van webinhoud.
- FileSurfer-agent: Beheert lokale bestanden, mappen en mappen.
- Codeeragent: Schrijft en voert code uit, analyseert informatie en creëert nieuwe projecten.
- ComputerTerminal-agent: Biedt een console voor programma-uitvoering door de Coder Agent.
Deze agenten werken samen om taken met een open einde op te lossen, waardoor Magnetic-One geschikt is voor toepassingen zoals software-engineering, data-analyse en wetenschappelijk onderzoek. Microsoft beschrijft Magnetic-One als een “flexibel en schaalbaar alternatief voor systemen met één agent” vanwege het modulaire ontwerp, waardoor agenten kunnen worden toegevoegd of verwijderd zonder de kernstructuur van het systeem te beïnvloeden.
Belangrijkste kenmerken
Magnetic-One onderscheidt zich door zijn vermogen om meerdere agenten te activeren met behulp van één taalmodel. Het systeem kan verschillende taken uitvoeren, van het navigeren door webbrowsers tot het uitvoeren van Python-code. Deze functionaliteit betekent dat het realistische scenario’s kan verwerken, zoals het boeken van tickets, het kopen van producten of het bewerken van documenten op een lokaal apparaat.
De modulaire multi-agentarchitectuur zorgt ervoor dat elke agent een afzonderlijke verantwoordelijkheid heeft, wat resulteert in een hogere efficiëntie bij complexe taken die uit meerdere stappen bestaan. Deze aanpak stelt Magnetic-One in staat een probleem in subtaken op te delen, waardoor zowel de nauwkeurigheid als de snelheid van taakvoltooiing worden verbeterd. Als het systeem bijvoorbeeld wordt gevraagd een bioscoopkaartje te boeken, zal elke agent een ander deel van de taak afhandelen, zoals het verwerken van visuele informatie, het navigeren op de website en het voltooien van de transactie.
Het AutoGen-framework van Microsoft drijft Magnetic-One aan en ondersteunt integratie met verschillende grote en kleine taalmodellen om aan verschillende kosten- en prestatie-eisen te voldoen. Momenteel wordt het systeem getest met modellen als GPT-4o en OpenAI’s o1-preview, hoewel het model-agnostisch blijft, wat toekomstige flexibiliteit mogelijk maakt.
Om de effectiviteit van Magnetic-One te beoordelen heeft Microsoft ook AutoGenBench uitgebracht, een tool die de prestaties van agenten evalueert op verschillende benchmarks zoals GAIA, AssistantBench en WebArena. Deze benchmarks zijn gericht op taken als meerstapsplanning en gereedschapsgebruik. De eerste tests van Microsoft uit oktober 2024 geven aan dat Magnetic-One concurrerende resultaten levert op basis van de modernste methoden.
Video: Microsoft
De groeiende trend: Multi-agentsystemen
Magnetic-One maakt deel uit van een groeiende trend naar multi-agent AI-systemen. OpenAI heeft Swarm geïntroduceerdeen ander raamwerk gericht op het bouwen en inzetten van multi-agentsystemen. Op dezelfde manier lanceerde IBM de Bee Agent-frameworkeen open-source toolkit die de implementatie van op agenten gebaseerde workflows ondersteunt, compatibel met modellen zoals IBM Graniet En Lama 3.2. Deze systemen zijn, net als Magnetic-One, bedoeld om schaalbare oplossingen te bieden voor complexe probleemoplossende taken.
Volgens Microsoft “ondersteunt het plug-and-play-ontwerp van Magnetic-One eenvoudige aanpassing en uitbreidbaarheid doordat agenten kunnen worden toegevoegd of verwijderd zonder andere agenten of de algehele architectuur te veranderen.” Deze flexibiliteit is vooral belangrijk voor de veranderende zakelijke behoeften en nieuwe toepassingen, waardoor Magnetic-One een veelbelovend hulpmiddel is voor onderzoekers en ontwikkelaars die meer adaptieve AI-systemen willen creëren.
Uitgelichte afbeeldingscredits: Kerem Gülen/Ideogram