Qwen3 laat zien dat open modellen nog steeds kunnen rivaal gesloten reuzen

Alibaba uitgegeven Qwen3, een familie van AI -modellen die het bedrijf claimt overeenkomen en soms beter presteren dan de beste modellen van Google en Openai, op maandag. De modellen variëren in grootte van 0,6 miljard parameters tot 235 miljard parameters en zijn te downloaden onder een “Open” -vergunning van AI Dev -platform Knuffelen En Gitub.

De QWEN3 -modellen worden beschreven als “hybride” omdat ze tijd kunnen nemen om “te redeneren” door complexe problemen of eenvoudiger verzoeken snel te beantwoorden. Dit redeneervermogen stelt de modellen in staat om zichzelf effectief te controleren, vergelijkbaar met het O3-model van Openai, maar met een hogere latentie. Volgens het QWEN-team hebben ze “naadloos geïntegreerd denken en niet-denkende modi, waardoor gebruikers de flexibiliteit bieden om het denkbudget te beheersen.”

Sommige QWEN3 -modellen hanteren een combinatie van experts (MOE) architectuur, die meer computationeel efficiënter kan zijn voor het beantwoorden van vragen. MOE breekt taken op in subtaken en delegeert ze aan kleinere, gespecialiseerde “expert” -modellen. De modellen ondersteunen 119 talen en werden getraind op een dataset van bijna 36 biljoen tokens, inclusief schoolboeken, vraag-antwoordparen, codefragmenten en door AI gegenereerde gegevens.

Qwen3 laat zien dat open modellen nog steeds kunnen rivaal gesloten reuzen — Benchmarks gedeeld door Alibaba

Alibaba Beweert dat de mogelijkheden van Qwen3 sterk zijn verbeterd in vergelijking met zijn voorganger, QWEN2. Het grootste QWEN3-model, QWEN-3-235B-A22B, presteert competitief op benchmark-evaluaties, waarbij Openai’s O3-Mini en Google’s Gemini 2.5 Pro op CodeForces wordt verslagen, een platform voor programmeerwedstrijden. Het presteert ook beter dan O3-Mini over de nieuwste versie van Aime, een uitdagende wiskundige benchmark en BFCL, een test voor het beoordelen van het vermogen van een model om over problemen te redeneren.

Qwen3 laat zien dat open modellen nog steeds kunnen rivaal gesloten Giants_02 — Benchmarks gedeeld door Alibaba

Hoewel QWEN-3-235B-A22B niet openbaar beschikbaar is, is het grootste openbare QWEN3-model, QWEN3-32B, nog steeds concurrerend met verschillende eigen en open AI-modellen. Qwen3-32B overtreft het O1-model van OpenAI op verschillende tests, waaronder de codering benchmark livecodebench. Alibaba zegt dat Qwen3 uitblinkt in tools-callingmogelijkheden, het volgen van instructies en het kopiëren van specifieke gegevensformaten.

Tuhin Srivastava, mede-oprichter en CEO van AI Cloud Host Baseten, merkte op dat Qwen3 een ander voorbeeld is van open modellen die gelijke tred houden met gesloten-bronsystemen zoals Openai’s. Hij voegde eraan toe dat modellen zoals Qwen3 waarschijnlijk in eigen land zullen worden gebruikt, ondanks Amerikaanse beperkingen op chipverkoop aan China.

Qwen3 is beschikbaar om te downloaden en via cloudproviders, waaronder vuurwerk AI en Hyperbolic.

Uitgelichte afbeeldingskrediet

Tags: Alibaba qwen

Qwen3 laat zien dat open modellen nog steeds kunnen rivaal gesloten reuzen

Related Posts

Netflix lanceert realtime interactief stemmen voor de livepremière van Star Search

Netflix plant een herontwerp van de mobiele app in 2026 om de dagelijkse gebruikersbetrokkenheid te vergroten

OpenAI dwingt veiligheidsfilters af voor tieners via gedragsmatige leeftijdsvoorspelling

Setapp Mobile stopt per 16 februari met zijn activiteiten in de EU

Google lanceert gratis SAT-oefenexamens in Gemini met Princeton Review

Samsung lekt en verwijdert vervolgens de Bixby-revisie met Perplexity-zoekopdracht

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Qwen3 laat zien dat open modellen nog steeds kunnen rivaal gesloten reuzen

Related Posts

Netflix lanceert realtime interactief stemmen voor de livepremière van Star Search

Netflix plant een herontwerp van de mobiele app in 2026 om de dagelijkse gebruikersbetrokkenheid te vergroten

OpenAI dwingt veiligheidsfilters af voor tieners via gedragsmatige leeftijdsvoorspelling

Setapp Mobile stopt per 16 februari met zijn activiteiten in de EU

Google lanceert gratis SAT-oefenexamens in Gemini met Princeton Review

Samsung lekt en verwijdert vervolgens de Bixby-revisie met Perplexity-zoekopdracht

Recent Posts

Recent Comments

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

Follow Us