Advocat i membre de l'ICAB

La propietat intel·lectual en temps de DALL-E (I)

"Eines com DALL-E no produeixen obres transformant imatges prèvies, sinó que en creen de noves amb patrons"

Tot i que els sistemes d'intel·ligència artificial (IA) capaços de generar textos o imatges de manera més o menys autònoma no són una cosa completament nova, els increïbles avenços que hem pogut experimentar en aquest camp durant els darrers mesos amb programes com DALL-E, Stable Diffusion o Midjourney (per només citar els més famosos), estan generant un debat públic sobre l'ús d'aquestes tecnologies i la seva relació amb la tasca creativa d'artistes, dissenyadors gràfics i creadors de contingut de tota mena, del treball dels quals es nodreixen aquestes intel·ligències artificials.

Les ramificacions d'aquest debat són incomptables, però en les línies següents tractarem de resumir breument els múltiples reptes legals que la irrupció d'aquestes noves intel·ligències artificials i la seva integració en la producció cultural suposen per als nostres sistemes jurídics.

Una intel·ligència artificial pot ser un autor?

Els darrers desenvolupaments en el camp de la generació d'imatges fan que recuperi una peculiar vigència l'observació, atribuïda a Picasso, segons la qual “la qualitat d'un pintor depèn de la quantitat de passat que porti amb si mateix”. Precisament, els models d'intel·ligència artificial s'entrenen amb milions i milions d'imatges i d'altres dades associades a aquestes. És l'enorme quantitat d'imatges emprades la que permet l'emergència o l’aparició de patrons ocults per a l'ull humà, que la intel·ligència artificial detecta i després utilitza per generar noves obres. Utilitzant un símil humà, podríem dir que aquestes intel·ligències artificials s’inspiren en les imatges preexistents, creades per artistes de carn i ossos, per produir les seves pròpies creacions originals.

"Les legislacions existents només reconeixen la condició d'autor a ‘persones naturals’ i és molt difícil que les obres creades per una IA puguin ser objecte de propietat intel·lectual"

Tanmateix, aquests símils entre el procés creatiu humà i l’activitat de les intel·ligències artificials, encara que il·lustratius, resulten insuficients i sovint polèmics. Molts dubten que les obres produïdes per aquests programes puguin ser qualificades d’originals o que una màquina pugui tenir creativitat, elements essencials de la propietat intel·lectual tal com la concebem avui dia. Això, juntament amb el fet que la pràctica totalitat de les legislacions existents només reconeixen la condició d'autor a “persones naturals”, fa que sigui molt difícil que aquestes obres creades per una IA, sense intervenció humana, puguin ser objecte de propietat intel·lectual, i alguns països, com els Estats Units, ja s'han pronunciat en el sentit de negar que puguin registrar-se com a obres protegides aquelles que siguin produïdes per “a machine or mere mechanical process that operates randomly or automatically with any creative input or intervention from human author”.

El debat continua obert avui dia, i atesa la creixent importància econòmica d'aquest sector, no es pot descartar que en un futur pròxim les diverses legislacions nacionals s'adaptin per respondre expressament a aquestes qüestions, sigui incloent les obres generades per una intel·ligència artificial en l'àmbit dels drets d'autor o creant nous drets o mecanismes de protecció legal per a aquesta mena d'obres. En qualsevol d'aquests casos, caldrà definir a qui corresponen aquests drets, cosa que tampoc no és una tasca senzilla: ha de ser titular dels drets el programador de la IA, el llicenciatari del programa o el prompt enginyer que introdueix les ordres per generar cadascuna de les imatges? Alguns, fins i tot, han propugnat dotar de personalitat jurídica la mateixa IA, que passaria a ser així l'autèntic “autor” de l'obra.

Es poden fer servir les meves imatges per entrenar una IA sense el meu permís?

Una altra de les qüestions més polèmiques durant els darrers mesos ha tingut a veure amb el fet que algunes de les bases de dades utilitzades per entrenar aquestes intel·ligències artificials contenen obres obtingudes sense consentiment dels seus autors, o cedides per a altres usos no comercials. Això suposa una vulneració dels seus drets de propietat intel·lectual?

"Per analitzar obres, a vegades la IA realitza una còpia digital de les dades, les transforma i les conserva a les seves bases de dades. Actes que vulnerarien els drets exclusius de l'autor"

El procés d'obtenció i tractament massiu de dades digitals per trobar patrons a través de tècniques de big data, com el que fan les intel·ligències artificials que hem esmentat, és el que es coneix com a mineria de dades o data mining. Per a alguns defensors d'aquesta pràctica, quan la intel·ligència artificial analitza les imatges o textos per extreure la informació, el que fa és anàleg al que passa quan un humà llegeix un text o mira una imatge i el cervell aprèn del que veu. Per a aquestes persones, “el dret a llegir és el dret a minar”. Però per a altres, la mineria de dades suposa molt més que un simple exercici de lectura, ja que per analitzar les obres, la intel·ligència artificial realitza una còpia digital de les mateixes, la transforma i en moltes ocasions les conserva a les seves bases de dades. Actes, tots plegats, que vulnerarien els drets exclusius de l'autor.

En alguns casos, aquestes obres poden estar publicades en fonts d'accés públic, com ara les xarxes socials, però això no significa que el seu autor hagi cedit cap dels seus drets de propietat intel·lectual sobre elles, per la qual cosa la reproducció de les mateixes per la intel·ligència artificial suposaria a priori una vulneració dels drets d'autor.

Extracte de les condicions generals de la base de dades LAION-400M

En altres casos, les imatges utilitzades per entrenar les IA han estat recopilades de repositoris o dades amb llicències Creative Commons o similars. Aquest tipus de llicències sí que permeten la lliure reproducció de les imatges, si bé amb certes restriccions, com ara que no se'n faci un ús comercial (CC NC), que no es facin obres derivades (CC ND) o que les obres derivades també es comparteixen sota una llicència similar (CC SA), i, en tot cas, reconeixent sempre l'autor de l'obra original (CC BY). En aquests casos, l'ús de l'obra per a l'entrenament de les IA podria ser legal, però alguns autors han mostrat el seu malestar amb què s'aprofiti l'ús d'una imatge protegida per llicències de copyleft per a fins comercials i sense cap mena de reconeixement de l’autor original.

Tot i això, atesa la importància de les tècniques de big data i d'intel·ligència artificial, tant per a la recerca acadèmica i científica com per a l'economia digital, i per tal de no crear obstacles a la innovació, els diferents Estats han implementat diverses reformes legals per permetre la pràctica del data mining, intentant respectar alhora els drets dels autors.

Als Estats Units i al món anglosaxó, per exemple, la mineria de dades s'ha considerat com un supòsit de fair use, és a dir, que no vulnera els drets de copyright de l'obra original, en tenir com a fi un ús no relacionat amb aquesta obra original i que no afecta la seva explotació normal. A la Unió Europea, d'altra banda, s'ha elaborat la Directiva 2019/790, l'article 4 de la qual estableix el dret de qualsevol persona a utilitzar tècniques de mineria de dades sobre qualsevol obra, tant per a fins comercials com científics, sempre que hagi accedit a aquesta obra de manera lícita i que el seu autor no s'oposi expressament i de manera adequada a aquest ús.

Aquesta Directiva s'ha traduït, en el cas d'Espanya, al Reial decret llei 24/2021, de 2 de novembre. Per tant, actualment a Espanya, si no desitgem que les nostres obres siguin utilitzades per entrenar una intel·ligència artificial, caldrà publicar-la únicament en repositoris d'accés restringit o en llocs d'accés al públic, però on consti, mitjançant mecanismes tècnics adequats, la nostra oposició al tractament automatitzat. En cas contrari, qualsevol que tingui accés legal a les obres (per exemple, per tenir una subscripció a la base de dades on estan publicades) les podrà utilitzar per entrenar una intel·ligència artificial, si bé només podrà conservar les còpies de les obres durant el temps necessari per a aquest fi. Per descomptat, no podrà distribuir les nostres obres originals ni utilitzar-les de cap altra manera que vulneri els nostres drets d'autor. Essent això així, cal preguntar-se si la generació de noves imatges a partir de les obres originals esmentades pot suposar un ús que va més enllà del mer entrenament i, per tant, constituir una violació dels drets d'autor.

"La majoria dels experts han entès que les obres generades amb IA no guarden una relació substancial amb cap de les obres amb les quals ha estat entrenada"

Aquest ha estat sens dubte un dels aspectes més candents del debat sobre aquestes noves tecnologies, i està relacionat amb l'enorme dificultat que hi ha per entendre com treballen aquestes intel·ligències artificials exactament. Si bé és cert que els drets de propietat intel·lectual inclouen el dret exclusiu de l'autor de permetre (o no) la transformació de la seva obra, és a dir, per crear allò que es coneix com a “obres derivades”, les eines com DALL-E, en principi, no produeixen les seves obres transformant altres imatges prèvies, sinó que creen imatges completament noves a partir dels patrons extrets del seu entrenament.

Encara que per a alguns aquesta distinció és un mer artifici intel·lectual, la majoria dels experts han entès que les obres generades per la intel·ligència artificial no guarden una relació substancial amb cap de les obres, individualment considerades, amb les quals ha estat entrenada, i que per tant no ens trobem davant d'obres derivades. Per això, en teoria, no s'estaria infringint la normativa de propietat intel·lectual. Però a la pràctica, la gran complexitat dels algorismes emprats i la seva opacitat fan que moltes vegades sigui impossible determinar realment fins a quin punt la IA s'ha basat en una altra obra original, cosa que ha estat objecte de dures crítiques per part de molts experts, que advoquen per una regulació que exigeixi una major transparència d'aquest tipus d'algorismes.

Sigui com sigui, el funcionament automàtic i no supervisat de la IA fa que sigui possible que es generin continguts substancialment iguals a altres obres contingudes al material d'entrenament o, fins i tot, que coincideixin amb altres obres ja existents de manera totalment casual. Per evitar conflictes en aquests casos, les mateixes empreses pioneres en utilitzar solucions d'IA en els seus productes estan desenvolupant alhora programes que, basant-se també en la intel·ligència artificial, puguin identificar possibles duplicats d'altres creacions preexistents que poguessin suposar alguna infracció dels drets de propietat intel·lectual dels seus autors.