OpenAI rep la primera demanda per drets d’autor per ChatGPT
Dos escriptors estatunidencs acusen l’empresa d’haver utilitzat les seves obres per entrenar el model d’IA sense el seu consentiment
Categories:
D’ençà del llançament de ChatGPT i l’auge de les intel·ligències artificials generatives, la legalitat ha estat una de les qüestions més polèmiques d’aquestes noves tecnologies. Molts creadors han acusat les empreses creadores dels models de fer servir obres protegides per drets d’autor per entrenar les xarxes neuronals sense un consentiment explícit. A principis d’any, un grup d’artistes va imposar una demanda col·lectiva a Stable AI, Midjourney i DeviantArt per aquest motiu, i ara és OpenAI qui rep la mateixa acció legal.
Els autors de la demanda són Mona Awad, autora de Bunny i 13 Ways of Looking at a Fat Girl, i Paul Tremblay, escriptor de The Cabin at the End of the World. Ambdós artistes van presentar la setmana passada un text al Tribunal Federal de San Francisco en què reclamaven que OpenAI havia utilitzat continguts dels seus llibres per entrenar el model GPT-4. L’acusació es basa en dos fets principals: la certesa que la companyia ha fet servir col·leccions de llibres disponibles en línia per alimentar els models de llenguatge i els resultats que ChatGPT dona quan se li pregunta per les seves obres.
En el primer cas, OpenAI va admetre en el seu moment que va entrenar GPT-1 amb 7.000 llibres provinents de BookCorpus, un corpus creat el 2015 per obres no publicades disponibles al web Smashwords.com. Tanmateix, els demandants assenyalen que aquests llibres es van copiar originalment sense permís i que moltes de les obres estan registrades sota copyright. D’altra banda, la demanda també apunta que el 15% del material amb què es va entrenar el model GPT-3 provenia de dos corpus de llibres disponibles a internet, però sense especificar de quins es tractaven.
La segona prova que els escriptors presenten és l’exactitud amb què ChatGPT és capaç de fer un resum o d’explicar parts dels llibres que han escrit. “Els sumaris tenen alguns detalls erronis. Això és esperable, ja que els grans models de llenguatge mesclen materials de diverses fonts”, puntualitza el document. “Tanmateix, la resta dels sumaris són precisos, la qual cosa vol dir que ChatGPT reté coneixement d’obres particulars en les bases de dades d’aprenentatge i és capaç de retornar un contingut textual similar”, conclou.