NVIDIA-leidinggevenden hebben toestemming gegeven voor het gebruik van miljoenen illegale boeken uit Anna's Archive voor AI-training, volgens een uitgebreide class action-rechtszaak. De rechtszaak, onder verwijzing naar interne NVIDIA-documenten, beweert dat het bedrijf contact heeft opgenomen met Anna's Archive voor snelle toegang tot zijn gegevens. NVIDIA heeft geprofiteerd van de hausse op het gebied van kunstmatige intelligentie, waarbij de inkomsten enorm zijn gestegen als gevolg van de grote vraag naar zijn AI-leerchips en datacenterdiensten. NVIDIA ontwikkelt zijn eigen AI-modellen, waaronder NeMo, Retro-48B, InstructRetro en Megatron. Deze modellen worden getraind met behulp van NVIDIA-hardware en grote tekstbibliotheken, vergelijkbaar met de praktijken bij andere technologiebedrijven. Het bedrijf heeft te maken gehad met juridische uitdagingen van auteursrechthouders met betrekking tot zijn trainingsmethodologieën. Auteurs hebben NVIDIA begin 2024 voor het eerst aangeklaagd wegens inbreuk op het auteursrecht, waarbij ze beweerden dat de AI-modellen van het bedrijf waren getraind op de Books3-dataset, die zonder toestemming auteursrechtelijk beschermde werken van Bibliotik bevatte. NVIDIA verdedigde haar acties als redelijk gebruik en stelde dat boeken statistische correlaties zijn met haar AI-modellen. Tijdens de ontdekking kwam er echter nieuw bewijsmateriaal naar voren. Eisers dienden afgelopen vrijdag een gewijzigde klacht in, waarbij de reikwijdte van de rechtszaak werd uitgebreid door meer boeken, auteurs en AI-modellen toe te voegen. De gewijzigde klacht omvat bredere ‘schaduwbibliotheek’-claims. Auteurs, waaronder Abdi Nazemian, citeren nu interne e-mails en documenten van NVIDIA, waarin ze beweren dat het bedrijf bereidwillig miljoenen auteursrechtelijk beschermde boeken heeft gedownload. De klacht beweert dat “concurrentiedruk NVIDIA tot piraterij heeft aangezet”, waarbij werd samengewerkt met Anna's Archive. Volgens de gewijzigde klacht heeft een lid van NVIDIA's datastrategieteam contact opgenomen met Anna's Archive om te informeren naar het verkrijgen van illegaal gekopieerd materiaal voor het vooraf trainen van grote taalmodellen, waaronder Anna's Archive. In de klacht staat dat Anna's Archive tienduizenden dollars in rekening heeft gebracht voor “snelle toegang” tot zijn collecties, en NVIDIA zocht details over deze toegang. De klacht beweert dat Anna's Archive NVIDIA heeft gewaarschuwd dat de bibliotheekinhoud illegaal is verkregen en onderhouden. Anna's Archive heeft naar verluidt leidinggevenden van NVIDIA om interne toestemming gevraagd om door te gaan, die binnen een week werd verleend. Na toestemming te hebben gekregen van het NVIDIA-management, bood Anna's Archive toegang tot zijn illegale boeken. Anna's Archive bood NVIDIA toegang tot ongeveer 500 terabytes aan gegevens, waaronder miljoenen boeken die doorgaans beschikbaar zijn via het digitale uitleensysteem van Internet Archive. In de klacht wordt niet gespecificeerd of NVIDIA Anna's Archive heeft betaald. NVIDIA wordt ook geconfronteerd met beschuldigingen van het gebruik van andere illegale bronnen, waaronder LibGen, Sci-Hub en Z-Library, naast de Books3-database. Auteurs beweren dat NVIDIA niet alleen illegale boeken heeft gedownload en gebruikt voor haar AI-training, maar ook scripts en tools heeft gedistribueerd waarmee zakelijke klanten 'The Pile' kunnen downloaden, die de illegale Books3-dataset bevat. Deze beschuldigingen introduceren nieuwe claims van plaatsvervangende en bijdragende inbreuk, waarbij wordt beweerd dat NVIDIA inkomsten genereerde van klanten door de toegang tot deze illegale datasets te vergemakkelijken. De auteurs eisen schadevergoeding voor de genoemde auteurs en mogelijk honderden anderen die zich bij de class action-rechtszaak aansluiten. Deze onthulling markeert de eerste openbare openbaarmaking van correspondentie tussen een groot Amerikaans technologiebedrijf en Anna's Archive. De eerste geconsolideerde en gewijzigde klacht, ingediend bij de US District Court voor het noordelijke district van Californië, noemt de auteurs Abdi Nazemian, Brian Keene, Stewart O'Nan, Andre Dubus III en Susan Orlean.





