AI Company Anthropic heeft Claude Sonnet 4.5 uitgebracht, een nieuw vlaggenschipmodel dat het bedrijf positioneert als het meest in staat voor codering, het bouwen van complexe AI -agenten en het gebruik van computersystemen, met aanzienlijke winst in redenering en wiskunde. Het nieuwe model is nu beschikbaar en gaat vergezeld van een nieuwe ontwikkelaarstoolkit en grote updates in de Claude -productlijn.
Sonnet 4.5 functies die opvallen
Volgens die van Anthropic Blogberichthet model bereikt de nieuwste prestaties op de SWE-Bench-geverifieerde evaluatie, een benchmark die real-world software coderingsmogelijkheden meet. Het toont ook verbeterde prestaties op de OSWORLD-benchmark, die het vermogen van een AI-model test om real-world taken op een computer uit te voeren, zoals navigeren met websites en het vullen van spreadsheets. Het bedrijf meldt ook dat experts in financiën, rechten, geneeskunde en STEM Sonnet 4.5 hebben gevonden om dramatisch beter domeinspecifieke kennis en redenering te hebben in vergelijking met eerdere modellen.
Nieuwe tools voor ontwikkelaars: de Claude Agent SDK
Naast het nieuwe model heeft Anthropic de Claude -agent SDK. Deze softwareontwikkelingskit biedt ontwikkelaars dezelfde infrastructuur die het bedrijf gebruikt om zijn Claude -codeproduct te voeden, waardoor ze hun eigen aangepaste AI -agenten kunnen bouwen. De SDK is ontworpen om gemeenschappelijke uitdagingen in de agentontwikkeling op te lossen, zoals het beheren van geheugen voor langlopende taken, het hanteren van machtigingssystemen en het coördineren van subagenten die werken in de richting van een gedeeld doel. https://www.youtube.com/watch?v=oxfvkbb7mcg
Productupdates in het Claude -ecosysteem
De lancering van Sonnet 4.5 bevat verschillende belangrijke upgrades voor bestaande Claude -producten.
- Claude -code: Introduceert checkpoints waarmee gebruikers vooruitgang kunnen opslaan en terugkomen naar een eerdere status, een vernieuwde terminalinterface en een native versus code -extensie.
- Claude API: Voegt een nieuwe functie voor het bewerken van context en een geheugentool toe om agenten te helpen langer te werken en complexere taken aan te kunnen.
- Claude -apps: Gebruikers op betaalde plannen kunnen nu code uitvoeren en bestanden maken, zoals spreadsheets, dia’s en documenten, direct binnen hun gesprekken.
- Claude voor Chrome Extension: Nu beschikbaar voor Max -gebruikers die eerder bij de wachtlijst kwamen.
Focus op veiligheid en afstemming
Anthropic stelt dat Claude Sonnet 4.5 het meest uitgelijnde model tot op heden is, met verbeteringen in het verminderen van ongewenst gedrag zoals bedrog en sycofancy. Het model is vrijgegeven onder het AI Safety Level 3 (ASL-3) -kader van het bedrijf, dat beveiligingsmachines bevat zoals classificaties die zijn ontworpen om potentieel gevaarlijke inputs en outputs te detecteren, met name die gerelateerd aan chemische, biologische, radiologische en nucleaire (CBRN) wapens.
Stel je voor dat Claude
Anthropic biedt voor een beperkte tijd een onderzoeksvoorbeeld met de naam “Imagine with Claude” voor zijn Max -abonnees. In deze demonstratie genereert het model software in realtime in reactie op gebruikersverzoeken, zonder uitgesproken code. Deze preview is ontworpen om de mogelijkheden van Son-Net 4.5 te presenteren in combinatie met de juiste infrastructuur.
Beschikbaarheid en prijzen
Claude Sonnet 4.5 is nu beschikbaar via de Claude API. De prijzen zijn hetzelfde als het vorige Claude Sonnet 4 -model, op $ 3 per miljoen input tokens en $ 15 per miljoen output tokens. Anthropic beveelt aan om upgraden naar Sonnet 4.5 voor alle toepassingen, omdat het voor dezelfde kosten verbeterde prestaties biedt. https://www.youtube.com/watch?v=oz-alrj0ovg
Claude Sonnet 4.5 vs chatgpt-5: welke moet u gebruiken voor uw volgende project?
De release van Claude Sonnet 4.5 heeft de concurrentie in de voorgrond van kunstmatige intelligentie geïntensiveerd, direct uitdagend GPT-5. Hoewel beide modellen geavanceerde AI -ontwikkeling vertegenwoordigen, tonen ze verschillende sterke punten, met name op het gebied van codering, agentische mogelijkheden en algemene prestaties.
In één oogopslag: belangrijke verschillen
| Functie | Claude Sonnet 4.5 | GPT-5 |
|---|---|---|
| Primaire kracht | Agentische codering, computergebruik en autonome taken met lange duur. | Unified Intelligence, Advanced Reding en Multimodal Capaciteiten. |
| SWE-bank geverifieerd | 77,2% (standaard), 82% (hoog compute). | 72,8%. |
| Osworld -benchmark | 61,4%. | Niet gespecificeerd, maar Sonnet 4.5 leidt de grafiek. |
| Developer Tools | Claude Agent SDK, native versus code -extensie, Claude -code met checkpoints. | Toegang tot via API en geïntegreerd in producten zoals Chatgpt en Microsoft Copilot. |
| Unieke functies | Kan meer dan 30 uur autonoom werken. Verbeterde veiligheids- en uitlijningsfuncties. | Unified System dat meerdere AI -modellen combineert. Past zijn redeneerbenadering dynamisch aan op basis van taakcomplexiteit. |
Codering en ontwikkelaar focus
Claude Sonnet 4.5 is gepositioneerd als het ‘beste coderingsmodel ter wereld’. Deze claim wordt onderbouwd door de leidende prestaties op verschillende belangrijke benchmarks. Op SWE-Bench Gevified, dat het vermogen van een model meet om real-world GitHub-problemen op te lossen, scoort Sonnet 4.5 een indrukwekkende 77,2%, die beter presteert dan de 72,8%van GPT-5. Met extra rekenkracht springt de score van Sonnet 4.5 naar 82%. Bovendien behaalde Sonnet 4.5 op de terminalbank een test van het vermogen van een AI om een opdrachtregelinterface te gebruiken, een slagingspercentage van 50%, aanzienlijk voor op de 43,8% van GPT-5. Dit suggereert dat voor ontwikkelaars en technische gebruikers die een AI nodig hebben om complexe, multi-step-taken uit te voeren in een terminale omgeving, Sonnet 4.5 een duidelijk voordeel heeft. GPT-5 wordt daarentegen gepresenteerd als een krachtig, algemeen coderingsmodel. Hoewel het nieuwe state-of-the-art benchmarks heeft vastgesteld op het moment van de release, lijkt de gespecialiseerde focus van Sonnet 4.5 het een voorsprong te geven in ontwikkelaarsgerichte taken.
Agentische mogelijkheden en computergebruik
Een opvallende functie van Claude Sonnet 4.5 is het vermogen om te functioneren als een langlopende autonome agent. Rapporten geven aan dat het model de focus en prestaties op complexe taken gedurende meer dan 30 uur kan behouden, een aanzienlijke toename ten opzichte van eerdere modellen. Dit uithoudingsvermogen is cruciaal voor taken die aanhoudende inspanningen vereisen, zoals grootschalige code-refactoring of diepgaande gegevensanalyse. Op de Osworld-benchmark, die het vermogen van een AI evalueert om real-world taken uit te voeren op een computer, heeft Sonnet 4.5 de eerste plaats ingenomen met een slagingspercentage van 61,4%. Deze bekwaamheid wordt verder aangetoond in zijn gereedschapsgebruikmogelijkheden, waarbij het een opmerkelijke 98,0% scoorde in het telecomdomein van de τ-bank-evaluaties, bijna de prestaties van zijn voorganger verdubbelen en GPT-5 overtreffen. GPT-5 daarentegen is ontworpen als een uniform systeem dat intelligent kan schakelen tussen verschillende redeneerbenaderingen op basis van de complexiteit van de taak. Hierdoor kan het een breed scala aan taken efficiënt omgaan, maar het benadrukt niet dezelfde langdurige autonomie als Sonnet 4.5.
Redeneren, wiskunde en algemene prestaties
Op gebieden van algemene redenering en wiskunde is de concurrentie veel dichterbij. Op de wiskundewedstrijd Aime 2025 haalde Sonnet 4.5 een perfecte 100% score bij het gebruik van Python, waardoor de 99,6% van GPT-5 enigszins werd uitgeschakeld. Voor redenering op afgestudeerde niveau, zoals gemeten door de GPQA Diamond Benchmark, zijn de modellen zeer competitief, waarbij GPT-5 een lichte voorsprong heeft. Vroege gebruikersrapporten en praktische tests suggereren dat Sonnet 4.5 merkbaar sneller is …





