Lezers geven steeds meer de voorkeur aan de verzen die zijn gemaakt door algoritmen als ChatGPT boven de verzen die zijn geschreven door beroemde dichters als Shakespeare of Plath. Een recente studie onthult dat deelnemers niet alleen geen onderscheid kunnen maken tussen door AI geproduceerde gedichten en door mensen gemaakte gedichten, maar dat ze vaak de voorkeur geven aan de AI-varianten.
Het onderzoeken van het ontwerp en de resultaten van het onderzoek
Onderzoekers Brian Porter en Edouard Machery van de Universiteit van Pittsburgh voerden twee belangrijke experimenten uit waarbij meer dan 1.600 deelnemers betrokken waren. In de eerste presenteerden ze de lezers een selectie van tien gedichten, de helft van gerenommeerde dichters als TS Eliot en Emily Dickinson, en de andere helft gegenereerd door ChatGPT-3.5, dat tot doel had deze iconische stijlen na te bootsen. Verbazingwekkend genoeg waren veel lezers eerder geneigd te geloven dat de AI-gedichten menselijke creaties waren. De ironie? Men achtte het minder waarschijnlijk dat de werken van de klassieke dichters door mensenhanden waren gemaakt.
Zeg kaas, schrijf een haiku met de Poëziecamera
Bij het vervolgexperiment waren 696 nieuwe deelnemers betrokken die gedichten beoordeelden op basis van criteria als schoonheid en emotionele impact. Deze keer werden de lezers in groepen verdeeld: de ene kreeg te horen dat de gedichten door mensen waren geschreven, de andere kreeg te horen dat ze door AI waren gegenereerd en de laatste groep ontving geen informatie. De bevindingen wezen op een aanzienlijke vertekening: als lezers wisten dat een gedicht voortkwam uit AI, beoordeelden ze het lager. Omgekeerd, toen de identiteit van de auteur een mysterie was, kregen door AI gegenereerde gedichten vaak hogere beoordelingen dan die van menselijke auteurs.
Brian Porter merkte een interessante trend op in de voorkeuren van lezers. “De resultaten suggereren dat de gemiddelde lezer de voorkeur geeft aan gedichten die gemakkelijker te begrijpen zijn”, legt hij uit. Deelnemers interpreteerden de ingewikkelde aard van de regels van beroemde dichters vaak als tekenen van door AI gegenereerd werk, waarbij ze de artistieke intentie achter deze complexiteiten misten. Daarentegen leken de meer rechtlijnige AI-gedichten toegankelijk, waardoor lezers hun helderheid verkeerd interpreteerden als een indicator van menselijk kunstenaarschap.
Evaluaties van deskundigen brengen tegenstrijdige oordelen aan het licht
Verder onderzoek uitgevoerd door een team van de Spaanse UNED-universiteit, samen met de Argentijnse schrijver Patricio Pron, leverde intrigerende inzichten op toen experts hun mening gaven over door AI gegenereerde verhalen. Hier zegevierden menselijke auteurs in een door critici beoordeelde wedstrijd, die in schril contrast stond met de eerdere bevindingen van gewone lezers. “Het verschil tussen critici en gewone lezers is enorm”, merkte Julio Gonzalo van UNED op. Hij benadrukte dat hoewel door AI gegenereerde inhoud indruk kan maken op niet-experts, critici met kennis van zaken subtiliteiten kunnen onderscheiden die AI mogelijk niet onder woorden kan brengen.
Guillermo Marco, een andere onderzoeker van UNED, voegde hieraan toe: “AI is gemakkelijk om niet-experts te verwarren.” Zijn medewerkers ervoeren uit de eerste hand hoe een goed gemaakt AI-stuk aantrekkelijker kon lijken voor een ongetraind publiek dan een riskantere, diep resonerende menselijke creatie. Het vinden van klassieke gedichten die de erkenning door deskundigen in de weg kunnen staan, vormt echter een aanzienlijke uitdaging, een hindernis die het team van Porter in toekomstige studies wil aanpakken.
Een ander fenomeen dat tijdens de onderzoeken is waargenomen, is een algemeen scepticisme ten aanzien van door AI gegenereerde inhoud. Als deelnemers hoorden dat een gedicht door AI was gemaakt, beoordeelden ze het vaak minder gunstig. Porter speculeerde over deze culturele weerstand en suggereerde dat acceptatie van AI op creatief gebied nog ver weg is: “Ik ben er niet zeker van dat mensen ooit door AI gegenereerde poëzie volledig zullen accepteren – of zelfs door AI gegenereerde kunst in het algemeen.”
De nuances van dit onderzoek raken bredere thema’s in de sociologie en esthetiek, aangezien het onderzoek van Gonzalo en Marco benadrukt hoe culturele normen onze waardering voor kunst vormgeven. Zelfs een AI-taalmodel van bescheiden omvang bleek aan de meeste criteria voor gewone lezers te voldoen, wat bewijst dat machines boeiende inhoud kunnen genereren zonder de capaciteiten van de hedendaagse technologie te overschrijden.
Marco beweerde botweg dat hoewel AI een krachtig creatief hulpmiddel kan zijn, het altijd de menselijke input zal weerspiegelen, net zoals het automatisch afstemmen van apparaten in muziek. “Kunst gaat over het communiceren van menselijke ervaringen”, zei hij. Vooruitkijkend zijn de onderzoekers ook geïnteresseerd in de noodzaak van regelgevende maatregelen die transparantie in door AI gegenereerde inhoud garanderen. “Als lezers door AI gegenereerde teksten minder waarderen, en er geen waarschuwing is dat door AI gegenereerde tekst wordt gebruikt, bestaat het risico dat ze worden misleid”, aldus Porter.
Uitgelichte afbeeldingscredits: Growtika/Unsplash