Het controversiële onderwerp van rechtszaken over AI-auteursrecht wint aan populariteit, waarbij velen bepleiten dat het de hoogste tijd is dat AI-bedrijven de enorme hoeveelheden vrij verkregen gegevens gaan compenseren die hun generatieve systemen hebben versterkt.
In een recente golf van juridische geschillen is er in de Verenigde Staten en Europa een groot aantal rechtszaken ontstaan waarin schadevergoeding wordt geëist van AI-entiteiten. De procederende partijen variëren van individuele auteurs en kunstenaars tot grote mediaconglomeraten, die allemaal hun bezwaren uiten tegen de toe-eigening van hun creaties door AI voor het genereren van ondermaatse uitlopers.
Een impactvolle open brief van de Auteurs Gilde, met ruim 8.500 handtekeningen van vooraanstaande schrijvers als Margaret Atwood, Dan Brown en Jodi Picoult, heeft de makers van generatieve AI-toepassingen, waaronder ChatGPT en Bard, opgeroepen om het ongeoorloofde gebruik van literaire werken een halt toe te roepen en daarvoor een passende compensatie te bieden. Deze auteurs eisen herstel voor de gegevens die zijn ‘geoogst’ om deze AI-systemen te voeden, en vergelijken het met een onbetaald feestmaal.

Schrijvers vrezen ook dat generatieve AI hun vak kan ondermijnen door de markt te overspoelen met geautomatiseerde inhoud die is afgeleid van hun originele werken. Deze zorg werd onlangs benadrukt toen Amazon moest ingrijpen om het probleem aan te pakken van door AI gegenereerde boeken die de bestsellerlijsten overspoelen.
Voordat de Authors Guild in beroep ging, startten de auteurs Mona Awad en Paul Tremblay een juridische procedure tegen OpenAI. Ze beweerden inbreuk op het auteursrecht op grond van het feit dat ChatGPT’s nauwkeurige samenvattingen van hun boeken impliceerden dat de AI was getraind in hun auteursrechtelijk beschermde materiaal. Ze staan niet alleen in deze strijd; auteur en cabaretier Sarah Silverman heeft ook een rechtszaak aangespannen tegen OpenAI en Meta, waarbij ze hen beschuldigt van ongeoorloofde replicatie van haar autobiografie ‘The Bedwetter’. De complexiteit van de functionaliteit van generatieve AI zou de juridische geldigheid van deze claims echter kunnen bemoeilijken.
Het zijn niet alleen individuen die zich in de juridische strijd begeven. In een baanbrekende stap positioneerde The New York Times zichzelf als de eerste grote Amerikaanse nieuwszender die een rechtszaak aanspande tegen OpenAI, waarbij het gebruik van auteursrechtelijk beschermd materiaal bij de training en ontwikkeling van AI werd aangevochten.
Rechtszaken over AI-auteursrecht: de reden hierachter
Het opkomende fenomeen van rechtszaken over AI-auteursrecht is emblematisch voor een groeiend verzet tegen het ongecontroleerde gebruik van auteursrechtelijk beschermde inhoud door AI-bedrijven. Hoewel platforms als ChatGPT zijn ontwikkeld met behulp van internetgegevens, hebben ze dit gedaan zonder expliciete toestemming van de makers van die gegevens. Opvallend is dat de training van GPT-3 een overvloed aan bronnen omvatte, waaronder Wikipedia en Reddit. Dit proces kan onbedoeld delen van auteursrechtelijk beschermd materiaal bevatten, waardoor deze uitgebreide taalmodellen auteursrechtelijk beschermde werken beknopt kunnen samenvatten met een verontrustende mate van nauwkeurigheid.

Het probleem wordt groter als we kijken naar de raadselachtige aard van AI. Het ‘black box’-dilemma, waarbij de innerlijke werking van AI onduidelijk blijft, vergroot de angst dat AI een zondebok zou kunnen worden voor het ontlopen van verantwoordelijkheid bij zowel de besluitvorming als het genereren van inhoud.
De juridische stelling komt ook voort uit de bezorgdheid dat als AI-bedrijven doorgaan met het commercialiseren van deze ondoorzichtige systemen, deze AI-modellen naar voren zouden kunnen komen als het ultieme middel om een doel te bereiken. Het gevaar schuilt in een potentiële toekomst waarin beslissingen niet aan AI-systemen worden toevertrouwd vanwege hun doeltreffendheid of nauwkeurigheid, maar omdat ze de juridische en ethische beperkingen kunnen omzeilen die menselijk handelen binden.
Gegevensbronnen en methoden
AI-ontwikkeling, vooral bij generatieve AI-modellen zoals die centraal staan in talloze rechtszaken, is het proces van gegevensverzameling een cruciaal en controversieel aspect. De methoden en bronnen waaruit deze AI-systemen hun trainingsgegevens ontlenen, hebben aanzienlijke juridische en ethische implicaties, vooral als het gaat om auteursrechtelijk beschermd materiaal.
Generatieve AI-modellen, zoals GPT-3 of ChatGPT, worden getraind op enorme datasets die zijn verzameld uit verschillende online bronnen. Deze bronnen omvatten vaak openbare websites zoals Wikipedia en Reddit, maar kunnen ook meer controversiële repository’s omvatten, zoals schaduwbibliotheken of andere platforms waar auteursrechtelijk beschermd materiaal direct beschikbaar is. De training omvat niet alleen het eenvoudig verzamelen van gegevens, maar ook complexe processen om context-, stijl- en inhoudsnuances te begrijpen.

Het juridische grijze gebied
De juridische onduidelijkheid vloeit voort uit het feit dat de gegevens weliswaar openbaar toegankelijk zijn, maar dat de gebruiksrechten niet altijd duidelijk zijn. Content van een openbaar forum verbiedt bijvoorbeeld niet expliciet het gebruik ervan voor het trainen van AI, maar verleent ook geen toestemming. Dit grijze gebied heeft geleid tot talloze rechtszaken over AI-auteursrecht, waarbij eisers beweren dat hun intellectuele eigendomsrechten zijn geschonden door de opname van hun werk in AI-trainingssets zonder toestemming of compensatie.
Hoe schendt AI de mensenrechten?
Hoewel AI-technologieën revolutionair zijn, worden ze steeds meer onder de loep genomen op mogelijke schendingen van de mensenrechten, een zorg die nog verder wordt benadrukt in de context van rechtszaken over AI-auteursrecht.
Belangrijke kwesties zijn onder meer:
- Het vermogen van AI voor uitgebreide gegevensverzameling en -bewaking kan inbreuk maken op individuele privacyrechten.
- AI-systemen kunnen de vooroordelen in hun trainingsgegevens bestendigen, wat leidt tot discriminerende resultaten in verschillende sectoren, wat de zorgen onderstreept in de lopende rechtszaken over AI-auteursrecht.
- AI-gestuurde moderatie van inhoud kan onbedoeld de vrijheid van meningsuiting onderdrukken, een kwestie die kruist met de debatten over intellectueel eigendom in rechtszaken over AI-auteursrecht.
- In juridische omgevingen kunnen AI-instrumenten de besluitvorming beïnvloeden, wat mogelijk gevolgen kan hebben voor de eerlijkheid van processen en gerechtelijke processen.
- AI-gestuurde automatisering brengt uitdagingen met zich mee voor de rechten van werknemers als gevolg van het verdwijnen van banen en de noodzaak van aanpassing van het personeelsbestand.
- De ongelijke toegang en impact van AI kan de bestaande ongelijkheid verergeren, een zorg die parallel loopt met de rechtvaardige toegang en gebruiksrechten die centraal staan in rechtszaken over AI-auteursrecht.
- AI-systemen die het gedrag van gebruikers manipuleren, roepen vragen op over individuele autonomie en toestemming.
- De controle van AI over de verspreiding van informatie kan van invloed zijn op het recht van het publiek op toegang tot diverse en onbevooroordeelde informatie.
De pleidooien van kunstenaars voor auteursrechten tegen AI staan voor een zware strijd
Wat zijn de rechtszaken tegen AI?
De juridische arena wemelt momenteel van rechtszaken over AI-auteursrecht, waarbij verschillende zaken de spanning tussen generatieve AI-ondernemingen en auteursrechtnormen onder de aandacht brengen. Onder de procederende partijen bevinden zich diverse bedrijven die verstrikt zijn geraakt in deze juridische strijd waarbij veel op het spel staat.
Google: rechtszaak over gegevensverzameling
Google wordt geconfronteerd met een class action-rechtszaak de technologiegigant beschuldigt van misbruik van persoonlijke informatie en inbreuk op het auteursrecht. Er wordt beweerd dat Google gegevens heeft verzameld, waaronder afbeeldingen van datingsites, Spotify-afspeellijsten, TikTok-video’s en literatuur die is gebruikt om Bard te verfijnen. De claim, gelanceerd in juli 2023, suggereert dat Google aansprakelijk kan zijn voor schade van meer dan $ 5 miljard. De aanklagers kiezen voor anonimiteit en vertegenwoordigen een groeiende bezorgdheid over privacy en eigendomsrechten.
Deze golf van rechtszaken over AI-auteursrecht is niet zonder precedent. De zaak van de Author’s Guild uit 2015 tegen Google vormde een belangrijke juridische maatstaf. The Guild daagde de digitalisering van miljoenen boeken door Google uit door fragmenten online aan te bieden. De uitspraak was in het voordeel van Google en karakteriseerde het gebruik als transformatief en niet-concurrerend met de oorspronkelijke markt voor de boeken.
OpenAI: auteursrechtproblemen
OpenAI is ook in de juridische strijd beland, waarbij auteurs Paul Tremblay en Mona Awad inbreuk op het auteursrecht beweren. Hun advocaat, Butterick, vertegenwoordigt een breder cohort van auteurs wier werken, zo beweren zij, zijn gerepliceerd binnen de uitgebreide trainingsgegevens van OpenAI, die mogelijk meer dan 300.000 boeken tellen. De rechtszaak, ingediend in juni 2023, eist een niet bekendgemaakt bedrag aan schadevergoeding.

OpenAI en Microsoft: NYT-rechtszaak
Daarnaast The New York Times is gelanceerd een rechtszaak tegen zowel OpenAI als Microsoft. In de indiening van december 2023 wordt beweerd dat OpenAI miljoenen Times-artikelen heeft gebruikt om hun taalmodellen te trainen, die nu met de publicatie wedijveren wat betreft het leveren van betrouwbare informatie. Bovendien beweert de rechtszaak dat de modellen van OpenAI niet alleen de unieke stilistische flair van de Times weerspiegelen, maar ook de inhoud ervan woordelijk reciteren. The Times, een primeur voor een groot Amerikaans nieuwskanaal, zette eerder dit jaar de discussies over de auteursrechtkwestie voort, maar het mocht niet baten, wat culmineerde in deze baanbrekende rechtszaak.
Meta en OpenAI: de Silverman-zaak
De juridische stappen van komiek Sarah Silverman tegen Meta en OpenAI brengen beschuldigingen van inbreuk op het auteursrecht aan het licht, waarbij wordt gesteld dat zowel ChatGPT als het Large Language Model (Llama) van Meta AI zijn ontwikkeld met behulp van onrechtmatig verkregen gegevens die haar werk bevatten. De rechtszaak wijst op ‘schaduwbibliotheken’ zoals Library Genesis, Z-Library en Bibliotek, berucht om het delen van inhoud op basis van torrents, wat vaak gebeurt zonder wettelijke toestemming. In het bijzonder wordt in de zaak opgemerkt dat Meta’s Llama werd geïnformeerd door een dataset die bekend staat als de Pile. samengesteld door EleutherAI, dat naar verluidt gegevens uit Bibliotek bevat. Deze rechtszaak is in juli 2023 ingeleid.

GitHub, Microsoft en OpenAI: de controverse over de Copilot
Een collectieve rechtszaak over AI-auteursrecht richt zich op GitHub, Microsoft en OpenAI met betrekking tot de Copilot-tool. Deze AI-aangedreven service vult codefragmenten automatisch aan door te leren van de input van een programmeur. De eisers beweren dat Copilot op onrechtmatige wijze code uit de repository’s van GitHub ophaalt, waarbij de licentievereisten, inclusief de juiste toeschrijving, worden genegeerd. Naast auteursrechtklachten beschuldigt de rechtszaak GitHub ook van wanbeheer en fraude met persoonlijke gegevens. De zaak, die in november 2022 werd ingediend, heeft geleid tot herhaalde ontslagpogingen van Microsoft en GitHub.
Stabiliteit AI, Midjourney en DeviantArt: het geschil over artistieke integriteit
In januari 2023 was er een rechtszaak tegen AI-beeldgeneratorbedrijven Stabiliteit AI, Midjourney en DeviantArt. Eisers beweren dat deze platforms inbreuk maken op auteursrechten door training te geven in en afgeleiden te maken van de werken van de eisers. Bovendien is er onenigheid over het vermogen van deze tools om de stijlen van specifieke artiesten te repliceren. De voorzitter, William Orrick, sprak een voorlopig voornemen uit om de klacht af te wijzen.

Stabiliteit AI: de Getty Images-rechtszaken
De dubbele rechtszaken van Getty Images tegen Stability AI belichten het ongeoorloofd kopiëren en verwerken van talloze afbeeldingen en bijbehorende metagegevens waar Getty de rechten op heeft in Groot-Brittannië. Een daaropvolgende rechtszaak bij de Amerikaanse rechtbank voor het district Delaware weerspiegelt vergelijkbare schendingen van auteursrechten en handelsmerken. Het benadrukt ook de bezorgdheid over “bizarre of groteske” beelden die zijn gegenereerd met het Getty-watermerk, waardoor de reputatie van het gewaardeerde beeldarchief mogelijk wordt aangetast. Deze juridische stappen zijn gemaakt in januari 2023.
Belangrijke vragen die worden opgeworpen door deze rechtszaken over AI-auteursrecht
De opkomst van rechtszaken over AI-auteursrecht duidt op een verschuiving in de manier waarop we naar digitale creativiteit kijken. Deze spraakmakende juridische confrontaties roepen verschillende belangrijke vragen op die de auteursrechtwetgeving in relatie tot generatieve AI zouden kunnen herdefiniëren:
- Licenties voor AI-trainingsmateriaal: Is er een noodzaak voor licentieverlening wanneer AI-modellen worden getraind op auteursrechtelijk beschermde inhoud? Gezien het feit dat generatieve AI-systemen het trainingsmateriaal repliceren tijdens hun leerfase, hangt het juridische debat af van de vraag of deze replicatie onder redelijk gebruik valt of formele licenties vereist.
- Schending van het auteursrecht en AI-outputs: Maken de resultaten van generatieve AI inbreuk op de auteursrechten van de materialen die in de training worden gebruikt? Een belangrijk aspect voor de rechtbanken om te bepalen is of de overeenkomsten tussen AI-outputs en de trainingsgegevens gebaseerd zijn op beschermde of niet-beschermde inhoud. Bovendien moet de vraag wie de verantwoordelijkheid draagt voor eventuele inbreuken op het auteursrecht begaan door een AI-systeem nog worden opgelost.
- Naleving van digitale auteursrechtwetten: Zijn generatieve AI-technologieën in strijd met wetten die de wijziging of verwijdering van informatie over auteursrechtbeheer regelen? Deze kwestie is vooral relevant in de zaak tegen Stability AI, waar door AI gegenereerde afbeeldingen valse informatie over het auteursrechtbeheer bevatten, zoals gereproduceerde watermerken.
- Recht op publiciteit en AI: Is het maken van door AI gegenereerde werken die de stijl van een specifiek individu nabootsen een inbreuk op hun recht op publiciteit? Dit recht, dat van land tot land verschilt, beperkt het gebruik van de gelijkenis, naam, afbeelding, stem of handtekening van een individu voor commerciële doeleinden zonder toestemming.
- Open source-licenties en AI: Hoe kruisen open source-licenties de training en distributie van door AI gegenereerde inhoud? Dit is een centrale zorg in de GitHub Copilot-rechtszaak, waarin eisers beweren dat het onvermogen om het bronmateriaal toe te schrijven en Copilot vrij te geven als open source in strijd is met de voorwaarden van open source-licenties.
Naarmate deze rechtszaken over AI-auteursrecht vorderen en antwoorden beginnen te bieden, moeten entiteiten die betrokken zijn bij de ontwikkeling en inzet van generatieve AI-tools alert zijn op opkomende richtlijnen op het snijvlak van AI en intellectueel eigendom. Het kan voor deze bedrijven ook verstandig zijn om strategieën te overwegen om potentiële risico’s op dit evoluerende juridische terrein te beperken. Rechtszaken over AI-auteursrecht benadrukken de noodzaak van een duidelijk beleid inzake datagebruik en -rechten.
Uitgelichte afbeeldingscredits: Igor Omilaev/Unsplash