Alibaba uitgegeven Qwen3, een familie van AI -modellen die het bedrijf claimt overeenkomen en soms beter presteren dan de beste modellen van Google en Openai, op maandag. De modellen variëren in grootte van 0,6 miljard parameters tot 235 miljard parameters en zijn te downloaden onder een “Open” -vergunning van AI Dev -platform Knuffelen En Gitub.
De QWEN3 -modellen worden beschreven als “hybride” omdat ze tijd kunnen nemen om “te redeneren” door complexe problemen of eenvoudiger verzoeken snel te beantwoorden. Dit redeneervermogen stelt de modellen in staat om zichzelf effectief te controleren, vergelijkbaar met het O3-model van Openai, maar met een hogere latentie. Volgens het QWEN-team hebben ze “naadloos geïntegreerd denken en niet-denkende modi, waardoor gebruikers de flexibiliteit bieden om het denkbudget te beheersen.”
Sommige QWEN3 -modellen hanteren een combinatie van experts (MOE) architectuur, die meer computationeel efficiënter kan zijn voor het beantwoorden van vragen. MOE breekt taken op in subtaken en delegeert ze aan kleinere, gespecialiseerde “expert” -modellen. De modellen ondersteunen 119 talen en werden getraind op een dataset van bijna 36 biljoen tokens, inclusief schoolboeken, vraag-antwoordparen, codefragmenten en door AI gegenereerde gegevens.

Alibaba Beweert dat de mogelijkheden van Qwen3 sterk zijn verbeterd in vergelijking met zijn voorganger, QWEN2. Het grootste QWEN3-model, QWEN-3-235B-A22B, presteert competitief op benchmark-evaluaties, waarbij Openai’s O3-Mini en Google’s Gemini 2.5 Pro op CodeForces wordt verslagen, een platform voor programmeerwedstrijden. Het presteert ook beter dan O3-Mini over de nieuwste versie van Aime, een uitdagende wiskundige benchmark en BFCL, een test voor het beoordelen van het vermogen van een model om over problemen te redeneren.

Hoewel QWEN-3-235B-A22B niet openbaar beschikbaar is, is het grootste openbare QWEN3-model, QWEN3-32B, nog steeds concurrerend met verschillende eigen en open AI-modellen. Qwen3-32B overtreft het O1-model van OpenAI op verschillende tests, waaronder de codering benchmark livecodebench. Alibaba zegt dat Qwen3 uitblinkt in tools-callingmogelijkheden, het volgen van instructies en het kopiëren van specifieke gegevensformaten.
Tuhin Srivastava, mede-oprichter en CEO van AI Cloud Host Baseten, merkte op dat Qwen3 een ander voorbeeld is van open modellen die gelijke tred houden met gesloten-bronsystemen zoals Openai’s. Hij voegde eraan toe dat modellen zoals Qwen3 waarschijnlijk in eigen land zullen worden gebruikt, ondanks Amerikaanse beperkingen op chipverkoop aan China.
Qwen3 is beschikbaar om te downloaden en via cloudproviders, waaronder vuurwerk AI en Hyperbolic.