Antropisch heeft geïntroduceerd een functie voor snelle verbetering die gebruikmaakt van een gedachtegang om de kwaliteit van de prompt te verbeteren en de uitvoernauwkeurigheid aanzienlijk te verbeteren. Deze nieuwe tool is bedoeld om ontwikkelaars te helpen bij het verfijnen van hun bestaande aanwijzingen, waardoor betere resultaten worden gegarandeerd bij het gebruik van hun AI-model, Claude.
Introductie van de promptverbetering voor verbeterde prompts
In de nieuwste update van Anthropic Console kunnen ontwikkelaars nu een promptverbeteraar gebruiken die is ontworpen om hun prompts automatisch te verbeteren met behulp van geavanceerde technieken. Claude, het AI-model van Anthropic, analyseert bestaande aanwijzingen en past systematische redenering toe, waardoor problemen effectief worden afgebroken voordat antwoorden worden gegenereerd. Volgens Anthropic helpt deze aanpak bij het identificeren en corrigeren van problemen binnen prompts en garandeert het ook een meer coherente en betrouwbare output.
Video: Antropisch
De introductie van deze functie komt op een moment dat snelle engineering cruciaal is geworden voor AI-toepassingen. Ontwikkelaars worstelen vaak met het opstellen van effectieve aanwijzingen, waarbij ze vaak best practices uit verschillende modellen integreren. De snelle verbeteraar heeft tot doel dit proces te stroomlijnen door het volgende mogelijk te maken:
- Keten-van-gedachte redenering: Een segment waarin Claude systematisch over het probleem nadenkt voordat hij reageert.
- Voorbeeld standaardisatie: Conversie van voorbeelden naar een consistent XML-formaat voor verbeterde duidelijkheid en verwerking.
- Voorbeeld verrijking: Verbetering van bestaande voorbeelden door redenering die aansluit bij de nieuw gestructureerde prompt.
- Herschrijven: Verduidelijking van de promptstructuur terwijl grammaticale of spelfouten worden gecorrigeerd.
- Toevoeging vooraf invullen: Assistent-berichten vooraf invullen om Claude’s output effectief te begeleiden.
Testen hebben veelbelovende resultaten opgeleverd, waarbij Anthropic een nauwkeurigheidsverhoging van 30% rapporteerde voor een classificatietaak met meerdere labels, naast een perfecte naleving van het aantal woorden bij het samenvatten van taken. Concreet, Claude behaalde een succespercentage van 100% bij het handhaven van gespecificeerde woordbeperkingen tijdens het samenvatten van tien artikelen geselecteerd uit Wikipedia.
De snelle verbeteraar vergemakkelijkt ook het beheer van meerdere voorbeeldinputs en -outputs. Ontwikkelaars kunnen nu nieuwe voorbeelden rechtstreeks aan het systeem toevoegen of bestaande voorbeelden bewerken voor een betere responskwaliteit. Als een ontwikkelaar moeite heeft om geschikte voorbeelden te maken, kan Claude synthetische voorbeelden genereren om het proces te vergemakkelijken. Deze functie verbetert:
- Nauwkeurigheid: Het verminderen van mogelijke verkeerde interpretaties van instructies.
- Samenhang: Ervoor zorgen dat het gewenste uitvoerformaat wordt bereikt.
- Prestatie: Het vergroten van Claude’s vermogen om complexere taken aan te pakken.
Evalueer de snelle effectiviteit met de snelle evaluator
Een andere handige functie bij de promptverbetering is een promptevaluator waarmee ontwikkelaars de effectiviteit van hun prompts onder verschillende scenario’s kunnen beoordelen. Deze evaluator introduceert een optionele kolom ‘ideale output’ op het tabblad Evaluaties, waardoor gebruikers de snelle prestaties systematisch kunnen benchmarken en verbeteren.
Zodra een nieuwe prompt is getest, kunnen ontwikkelaars feedback geven aan Claude en aangeven waar verdere verfijning nodig is. Deze iteratieve feedbacklus zorgt voor een verbeterde gebruikerservaring en kan een op maat gemaakte output opleveren die aansluit bij de gebruikersspecificaties. Als een ontwikkelaar bijvoorbeeld wil overstappen van XML- naar JSON-uitvoerformaten, kan Claude de aanwijzingen en voorbeelden dienovereenkomstig aanpassen.
Kapa.ai, een technologiebedrijf gespecialiseerd in het transformeren van technische kennis in AI-oplossingen, heeft de voordelen van deze functie al ervaren. Finn Bauer, medeoprichter van Kapa.ai, merkte op: “De snelle verbeteraar van Anthropic stroomlijnde onze migratie naar Claude 3.5 Sonnet en stelde ons in staat sneller tot productie te komen.” Deze goedkeuring weerspiegelt de efficiëntie en praktische toepassing van de nieuwe instrumenten in reële scenario’s.
Terwijl Anthropic blijft innoveren, wordt de uitrol van Claude 3.5 Opus wordt verwacht. Deze aankomende versie belooft een verdere integratie van redeneermogelijkheden, wat de algemene functionaliteiten van het vlaggenschip Claude-model kan verbeteren.
Gebruikers die graag aanwijzingen willen manipuleren, evalueren en stroomlijnen, hebben toegang tot deze functies in de Antropische console. Er is een informatieve reeks bronnen beschikbaar binnen de documentatie om ontwikkelaars door de ins en outs te leiden van het verbeteren van prompts met Claude, wat een opwindende kans biedt om AI-interacties tussen verschillende applicaties te verbeteren.
Uitgelichte afbeeldingscredits: Antropisch