Anthropic heeft de lancering aangekondigd van twee nieuwe AI-modellen: een verbeterde Claude 3.5 Sonnet en een nieuwe Claude 3.5 Haiku. De geüpgradede Claude 3.5 Sonnet biedt algemene verbeteringen, met aanzienlijke verbeteringen in codeermogelijkheden. De nieuwe Claude 3.5 Haiku biedt geavanceerde AI-functies tegen een betaalbare prijs, passend bij de prestaties van Anthropics vorige vlaggenschipmodel, Claude 3 Opus, terwijl de snelheid en kosten vergelijkbaar zijn met die van zijn voorganger.
Claude 3.5 Sonnet
De geüpgradede Claude 3.5 Sonnet bouwt voort op het succes van zijn voorganger met verbeterde prestaties bij verschillende taken, vooral bij het coderen. Anthropic heeft benadrukt dat Claude 3.5 Sonnet toonaangevend is op het gebied van software-engineering en duidelijke verbeteringen laat zien in benchmarks zoals SWE-bank geverifieerdwaar het verbeterde van 33,4% naar 49,0%, waarmee het andere modellen op de markt overtrof.
Het model presteerde ook goed bij het gebruik van agent-tools, waardoor de scores op de TAU-bank van 62,6% naar 69,2% in het retaildomein en van 36,0% naar 46,0% in het luchtvaartdomein. Volgens vroege testers als GitLab en Cognition vertegenwoordigen deze upgrades een substantiële sprong voorwaarts voor AI-aangedreven codering en automatisering, met betere redeneringsmogelijkheden en minimale toegevoegde latentie.
Claude 3.5 Haiku
Claude 3.5 Haiku is ontworpen om state-of-the-art prestaties te bieden en tegelijkertijd de kosten laag te houden. Het model scoort hoog in benchmarks zoals SWE-bench Verified, met een score van 40,6%, wat veel agenten overtreft die andere geavanceerde modellen gebruiken, waaronder de originele Claude 3.5 Sonnet en GPT-4o. Het model is bedoeld om toepassingen te bedienen die snelle, betrouwbare AI nodig hebben, zoals gebruikersgerichte producten en taken die gepersonaliseerde ervaringen vereisen.
Anthropic zal later deze maand Claude 3.5 Haiku uitbrengen, aanvankelijk beschikbaar als een tekstmodel met plannen voor ondersteuning voor beeldinvoer in de toekomst. Het zal beschikbaar zijn via de API van Anthropic, Amazon Bedrock en Vertex AI van Google Cloud.
Claude AI van Anthropic staat nu op je iPad
Computergebruik is beschikbaar als experimentele openbare bèta
Antropisch heeft dat ook geïntroduceerd een nieuwe experimentele functie genaamd ‘computergebruik’, beschikbaar in de openbare bèta. Ontwikkelaars kunnen Claude 3.5 Sonnet opdracht geven computers als een mens te gebruiken: naar schermen kijken, cursors verplaatsen en typen. Deze mogelijkheid is nog experimenteel, met enkele beperkingen, maar ontwikkelaars als Replit en The Browser Company zijn al begonnen met onderzoeken hoe het complexe processen kan automatiseren die veel stappen omvatten.
Deze functie is bedoeld om AI algemene computervaardigheden aan te leren, waardoor het veelzijdiger wordt bij het voltooien van taken waarvoor voorheen aangepaste tools nodig waren. Ontwikkelaars hebben toegang tot deze bèta via de API van Anthropic en andere grote cloudplatforms. Hoewel de eerste resultaten veelbelovend zijn, erkent Anthropic dat de technologie nog steeds in ontwikkeling is, met uitdagingen bij het uitvoeren van enkele veelvoorkomende computertaken zoals scrollen en slepen.
Bedrijven als Asana, Canva, Cognition en DoorDash experimenteren met de nieuwe functies en onderzoeken het potentieel van AI om processen te automatiseren die traditioneel menselijke input vereisten. Uit vroege tests door het Amerikaanse AI Safety Institute en het UK Safety Institute is gebleken dat de bijgewerkte Claude 3.5 Sonnet voldoet aan de veiligheidsnormen van Anthropic en geschikt is voor openbaar gebruik.
Anthropic pakt ook potentiële risico’s aan die verband houden met het vermogen van AI om met computers te communiceren. Om een verantwoorde inzet te garanderen, heeft het bedrijf nieuwe veiligheidsmaatregelen geïmplementeerd om misbruik te identificeren, inclusief classificaties om potentieel schadelijke acties op te sporen. Anthropic moedigt ontwikkelaars aan om de bètafunctie te gebruiken voor taken met een laag risico, terwijl de technologie volwassener wordt.
De release van Anthropic van de geüpgradede Claude 3.5 Sonnet en Claude 3.5 Haiku benadrukt de drang van het bedrijf om de AI-mogelijkheden uit te breiden met behoud van veiligheidsnormen. De toevoeging van mogelijkheden voor experimenteel computergebruik vertegenwoordigt een nieuwe stap voorwaarts in het potentieel van AI om algemene taken uit te voeren, waardoor ontwikkelaars nieuwe mogelijkheden krijgen om te verkennen.
Afbeeldingscredits: Antropisch