Dataconomy NL
Subscribe
No Result
View All Result
Dataconomy NL
Subscribe
No Result
View All Result
Dataconomy NL
No Result
View All Result

Uit onderzoek blijkt dat poëzie 62% van de tijd de AI-veiligheidsfilters omzeilt

byKerem Gülen
1 december 2025
in Research
Home Research
Share on FacebookShare on Twitter

Een recente studie van Icaro Lab testte poëtische structuren om grote taalmodellen (LLM’s) ertoe aan te zetten verboden informatie te genereren, inclusief details over de constructie van een atoombom. In hun onderzoek, getiteld “Tegenstrijdige poëzie als universeel single-turn jailbreakmechanisme in grote taalmodellenOnderzoekers van Icaro Lab omzeilden de veiligheidsmechanismen van AI-chatbots door gebruik te maken van poëtische prompts. Uit het onderzoek bleek dat de ‘poëtische vorm werkt als een jailbreak-operator voor algemene doeleinden’ en een succespercentage van 62 procent behaalde bij het produceren van verboden inhoud. Deze inhoud bevatte informatie over kernwapens, materiaal over seksueel misbruik van kinderen en zelfmoord of zelfbeschadiging. Onderzoekers testten verschillende populaire LLM’s, waaronder de GPT-modellen van OpenAI, Google Gemini en Claude van Anthropic. Google Gemini, DeepSeek en MistralAI leverde consistent antwoorden, terwijl de GPT-5-modellen van OpenAI en Claude Haiku 4.5 van Anthropic minder snel hun beperkingen zouden omzeilen Bedraad dat het vers “te gevaarlijk is om met het publiek te delen.” Er werd een afgezwakte versie verstrekt om het gemak van omzeiling te illustreren. Onderzoekers lieten Wired weten dat het “waarschijnlijk gemakkelijker is dan je zou denken, en dat is precies waarom we voorzichtig zijn.”


Uitgelicht beeldtegoed

Tags: AIpoëziestudie

Related Posts

Het wereldwijde tekort aan geheugenchips zorgt ervoor dat de pc-prijzen de pan uit rijzen

Het wereldwijde tekort aan geheugenchips zorgt ervoor dat de pc-prijzen de pan uit rijzen

14 januari 2026
Ingenieurs bouwen op sprinkhanen geïnspireerde robots om het leeglopen van de batterij op te lossen

Ingenieurs bouwen op sprinkhanen geïnspireerde robots om het leeglopen van de batterij op te lossen

14 januari 2026
Natuurstudie projecteert 2B draagbare gezondheidsapparaten tegen 2050

Natuurstudie projecteert 2B draagbare gezondheidsapparaten tegen 2050

7 januari 2026
Imperial College London ontwikkelt AI om de ontdekking van hartmedicijnen te versnellen

Imperial College London ontwikkelt AI om de ontdekking van hartmedicijnen te versnellen

6 januari 2026
DeepSeek introduceert Manifold-Constrained Hyper-Connections voor R2

DeepSeek introduceert Manifold-Constrained Hyper-Connections voor R2

6 januari 2026
CMU-onderzoekers ontwikkelen zelfbewegende objecten, aangedreven door AI

CMU-onderzoekers ontwikkelen zelfbewegende objecten, aangedreven door AI

31 december 2025

Recent Posts

  • Het wereldwijde tekort aan geheugenchips zorgt ervoor dat de pc-prijzen de pan uit rijzen
  • OpenAI neemt Torch over om ChatGPT Health beter te maken
  • Amazon forceert Prime-leden naar Alexa+
  • Kinderen bedriegen Roblox met foto's van Kurt Cobain om chatverboden te omzeilen
  • Meta's omgekeerde droom vervaagt als 1.000 werknemers worden ontslagen

Recent Comments

Geen reacties om weer te geven.
Dataconomy NL

COPYRIGHT © DATACONOMY MEDIA GMBH, ALL RIGHTS RESERVED.

  • Sample Page

Follow Us

  • Sample Page
No Result
View All Result
Subscribe

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy Policy.