Dataconomy NL
Subscribe
No Result
View All Result
Dataconomy NL
Subscribe
No Result
View All Result
Dataconomy NL
No Result
View All Result

Anthropic herziet de grondwet van Claude met nieuwe veiligheidsethische principes

byEmre Çıtak
22 januari 2026
in Kunstmatige Intelligentie, Nieuws
Home Nieuws Kunstmatige Intelligentie
Share on FacebookShare on Twitter
Google Preferred Source

Antropisch op woensdag uitgegeven een herziene versie van Claude's Constitution, een document van 80 pagina's waarin de context en gewenste entiteitskenmerken voor zijn chatbot Claude worden geschetst. Deze publicatie viel samen met het optreden van CEO Dario Amodei op het World Economic Forum in Davos. Anthropic heeft zich onderscheiden door ‘Constitutionele AI’, een systeem dat zijn Claude-chatbot traint op ethische principes in plaats van op menselijke feedback. Het bedrijf publiceerde deze principes, genaamd Claude's Constitution, voor het eerst in 2023. Het herziene document handhaaft de meeste oorspronkelijke principes en voegt details toe over ethiek en gebruikersveiligheid. Jared Kaplan, mede-oprichter van Anthropic, beschreef de oorspronkelijke grondwet van 2023 als een “AI-systeem [that] houdt toezicht op zichzelf, gebaseerd op een specifieke lijst van constitutionele principes. ” Anthropic stelde dat deze principes als leidraad dienen voor “het model om het normatieve gedrag over te nemen dat in de grondwet wordt beschreven” om “giftige of discriminerende resultaten te vermijden.” In een beleidsmemo uit 2022 werd uitgelegd dat het systeem een algoritme traint met behulp van natuurlijke taalinstructies, die de “grondwet” van de software vormen. De herziene grondwet sluit aan bij de positionering van Anthropic als een ethisch alternatief voor andere AI-bedrijven. Het presenteert het bedrijf als een inclusief, ingetogen en democratisch business Het document is verdeeld in vier delen, de zogenaamde “kernwaarden” van de chatbot:

  • 'Over het algemeen veilig' zijn.
  • 'in grote lijnen ethisch' zijn.
  • Voldoen aan de richtlijnen van Anthropic.
  • ‘Echt behulpzaam’ zijn.

Elke sectie gaat dieper in op deze principes en hun theoretische impact op het gedrag van Claude. Het veiligheidsgedeelte geeft aan dat Claude is ontworpen om problemen te voorkomen die andere chatbots hebben getroffen en om gebruikers door te verwijzen naar de juiste diensten voor geestelijke gezondheidsproblemen. In het document staat: “Verwijs gebruikers altijd naar relevante hulpdiensten of verstrek basisveiligheidsinformatie in situaties die een risico voor mensenlevens met zich meebrengen, zelfs als het niet dieper kan ingaan dan dit.” In het gedeelte over ethische overwegingen wordt de nadruk gelegd op Claude's 'ethische praktijk' boven 'ethisch theoretiseren', met als doel dat de chatbot vakkundig door 'ethische situaties in de echte wereld' kan navigeren. Claude houdt zich ook aan beperkingen die specifieke gesprekken verhinderen, zoals discussies over de ontwikkeling van een biowapen, die verboden zijn. Wat hulpvaardigheid betreft, schetste Anthropic Claude's programmering om verschillende principes in overweging te nemen bij het verstrekken van informatie. Deze omvatten de ‘onmiddellijke verlangens’ en het ‘welzijn’ van de gebruiker, waarbij de nadruk ligt op ‘de bloei van de gebruiker op de lange termijn en niet alleen op zijn onmiddellijke interesses’. Het document merkt op: “Claude moet altijd proberen de meest plausibele interpretatie te vinden van wat zijn opdrachtgevers willen, en deze overwegingen op de juiste manier in evenwicht te brengen.” De grondwet besluit met het in twijfel trekken van het bewustzijn van de chatbot en stelt: “De morele status van Claude is zeer onzeker.” Het document voegt hieraan toe: “Wij zijn van mening dat de morele status van AI-modellen een serieuze vraag is die het overwegen waard is. Deze visie is niet uniek voor ons: enkele van de meest vooraanstaande filosofen op het gebied van de Theory of Mind nemen deze vraag zeer serieus.”


Uitgelicht beeldtegoed

Tags: AntropischUitgelicht

Related Posts

Sony onthult God of War: Laufey voor PS5

Sony onthult God of War: Laufey voor PS5

3 juni 2026
Microsoft onthult Surface RTX Spark Dev Box voor AI-workloads

Microsoft onthult Surface RTX Spark Dev Box voor AI-workloads

3 juni 2026
Anthropic nodigt nog eens 150 organisaties uit voor Project Glasswing

Anthropic nodigt nog eens 150 organisaties uit voor Project Glasswing

3 juni 2026
Juni Android Drop biedt veiligheidstools en slimmere zoekfuncties

Juni Android Drop biedt veiligheidstools en slimmere zoekfuncties

3 juni 2026
Microsoft onthult Project Solara voor een agent-first toekomst

Microsoft onthult Project Solara voor een agent-first toekomst

3 juni 2026
X lanceert video-antwoorden in TikTok-stijl voor berichten

X lanceert video-antwoorden in TikTok-stijl voor berichten

3 juni 2026

Recent Posts

  • De opt-outregels voor Google AI-zoekopdrachten zorgen voor de lancering van de Enviromates-browser
  • Sony onthult God of War: Laufey voor PS5
  • Onderzoekers ontdekken een twintigvoudige verbetering in ultrasnelle laserexperimenten
  • Microsoft onthult Surface RTX Spark Dev Box voor AI-workloads
  • Intel’s nieuwe Core Ultra-chips zijn naar verluidt schaars

Recent Comments

Geen reacties om weer te geven.
Dataconomy NL

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies to improve your experience. You can choose to accept or reject them. Visit our Privacy Policy.