Microsoft aangekondigd de Maia 200-chip op maandag om AI-inferentie te schalen, met meer dan 100 miljard transistors voor hogere snelheden en hogere efficiëntie dan de Maia 100 uit 2023. De Maia 200 levert meer dan 10 petaflops in 4-bits precisie en ongeveer 5 petaflops in 8-bits prestaties. Microsoft noemt het een siliciumwerkpaard dat speciaal is ontworpen voor AI-inferentietaken. Dit proces omvat het uitvoeren van getrainde AI-modellen om output te genereren, los van de trainingsfase waarin deze modellen worden gebouwd. Naarmate AI-operaties zich uitbreiden, is inferentie nu verantwoordelijk voor een groeiend deel van de totale computerkosten, wat de inspanningen stimuleert om deze te stroomlijnen. Het bedrijf positioneert de Maia 200 om operationele verstoringen en energieverbruik bij AI-implementaties te verminderen. Eén enkel knooppunt uitgerust met de chip verwerkt de grootste huidige AI-modellen, terwijl er capaciteit overblijft voor aanzienlijk grotere modellen. Microsoft verklaarde: “In praktische termen kan één Maia 200-node moeiteloos de grootste modellen van vandaag draaien, met voldoende speelruimte voor nog grotere modellen in de toekomst.” Deze release sluit aan bij een patroon onder grote technologiebedrijven die aangepaste processors ontwikkelen om de afhankelijkheid van Nvidia's grafische verwerkingseenheden, die de AI-workloads domineren, te verminderen. Nvidia GPU's zijn een centrale rol gaan spelen in het succes van AI, wat aanleiding geeft tot alternatieven om de hardwarekosten te beheersen. Google biedt tensorverwerkingseenheden, of TPU's, niet als zelfstandige chips, maar als cloudgebaseerde computerbronnen. Amazon levert Trainium AI-acceleratorchips, waarbij de derde generatie Trainium 3 in december werd uitgebracht. Met deze opties kunnen bedrijven een deel van de werklast weghalen van Nvidia-hardware, waardoor de totale kosten worden verlaagd. Microsoft beweert dat de Maia 200 op belangrijke maatstaven beter presteert dan de concurrentie. Het behaalt drie keer de FP4-prestaties van Amazon's Trainium-chips van de derde generatie. De FP8-prestaties overtreffen die van Google's TPU's van de zevende generatie, zoals beschreven in het persbericht van het bedrijf van maandag. De chip ondersteunt al interne AI-inspanningen. Het drijft modellen aan die zijn ontwikkeld door het Superintelligence-team van Microsoft. De bewerkingen voor de Copilot-chatbot zijn ook afhankelijk van Maia 200-hardware. Vanaf maandag heeft Microsoft de uitnodigingen uitgebreid naar externe gebruikers. Ontwikkelaars, academici en grensverleggende AI-laboratoria hebben nu toegang tot de Maia 200-softwareontwikkelingskit om deze in hun werklasten te integreren.





