Advocaten van The New York Times en Daily News beweren dat OpenAI per ongeluk cruciale gegevens heeft verwijderd met betrekking tot hun auteursrechtzaak tegen het bedrijf met betrekking tot ongeoorloofd gebruik van hun inhoud, volgens een TechCrunch rapport. Het incident vond plaats nadat OpenAI ermee had ingestemd toegang te verlenen tot zijn trainingsdatasets om de eisers te helpen bij het verifiëren van het gebruik van hun auteursrechtelijk beschermde materialen.
De rechtszaak beweert dat OpenAI artikelen uit The New York Times en Daily News heeft geschrapt zonder toestemming te hebben gekregen om zijn modellen te trainen. Als reactie op de rechtszaak leverde OpenAI twee virtuele machines waarmee de advocaten van de uitgevers in de trainingsgegevens konden zoeken naar auteursrechtelijk beschermde inhoud. Sinds 1 november hebben de juridische teams meer dan 150 uur aan deze zoektocht besteed. Op 14 november hebben de technici van OpenAI echter per ongeluk alle zoekgegevens gewist die op een van de virtuele machines waren opgeslagen, zoals blijkt uit een verzoekschrift ingediend bij de Amerikaanse arrondissementsrechtbank voor het zuidelijke district van New York.
De pogingen van OpenAI om de verwijderde gegevens te herstellen waren grotendeels succesvol, maar het verlies van de mapstructuur en bestandsnamen maakte de herstelde gegevens onbruikbaar bij het volgen waar de artikelen van de eisers waren opgenomen in de training van de AI. In de brief van de raadsman van de eisers werd benadrukt dat zij hun werk moesten reconstrueren, wat veel middelen en tijd kostte.
Ondanks het verwijderen van de gegevens verduidelijkte de raadsman dat er geen aanwijzingen zijn dat het incident opzettelijk was. Ze uitten hun bezorgdheid over het feit dat OpenAI in een ideale positie verkeert om zijn eigen datasets te doorzoeken, wat wijst op een verplichting om te helpen bij het onderzoek naar mogelijke inbreuk op het auteursrecht.
OpenAI heeft macOS zojuist slimmer gemaakt met ondersteuning voor de ChatGPT-app
OpenAI beweert dat het gebruik van openbaar beschikbare gegevens voor het trainen van zijn modellen onder ‘fair use’ valt. Het bedrijf beweert dat het geen licenties hoeft te verlenen of deze inhoud te compenseren, ook al profiteert het van zijn AI-producten. Niettemin heeft OpenAI licentieovereenkomsten gesloten met verschillende uitgevers, waaronder prominente namen als Associated Press en Financial Times. Hoewel de specifieke voorwaarden van deze deals niet openbaar worden gemaakt, wordt gemeld dat Dotdash, een van de partners, jaarlijks minstens 16 miljoen dollar ontvangt.
OpenAI heeft nog geen verklaring afgegeven over het incident of de implicaties ervan voor de relatie met de eisers.
Uitgelichte afbeeldingscredits: Jonathan Kemper/Unsplash