L’OSI impulsa uns criteris per definir què és un model d’IA de codi obert
La iniciativa compta amb la participació d’una setantena d’experts i busca evitar que grans empreses com Meta s’apropiïn del terme
Categories:
Des que van començar a sorgir els primers models comercials d’intel·ligència artificial generativa, molts dels seus impulsors han vinculat les propostes al moviment del programari lliure, titllant les seves creacions de codi obert. La mateixa OpenAI duu la paraula al seu nom, malgrat tenir un dels models més tancats que hi ha al mercat, mentre que Meta va voler diferenciar el seu model Llama 2 i el successor Llama 3 de la resta d’alternatives al·legant que eren models de codi obert. Aquesta tendència ha estat criticada obertament per l’Open Source Initiative (OSI), una de les principals organitzacions dins del moviment, que ara treballa en una definició per delimitar què és i què no un model d’IA de codi obert.
La definició en què treballa l’OSI ha comptat amb la participació d’una setantena d’investigadors, advocats, legisladors i activistes, així com amb representants de les principals empreses tecnològiques dels Estats Units, com són Google, Meta i Amazon. Plegats han acordat un text, encara en format d’esborrany, que imposa quatre condicions innegociables per a qualsevol model d’IA de codi obert: ha de donar la llibertat per ser utilitzat per a qualsevol propòsit sense demanar permís, estudiat internament a través de tots els seus components, modificat amb qualsevol intencionalitat, incloent-hi un canvi en els resultats, i compartit amb altres persones per ser emprat amb modificacions o sense, sigui quin sigui el motiu.
Aquestes quatre condicions són hereves de la definició de codi obert que defensa l’OSI, que reivindica que qualsevol programari que es defineixi com a tal no pot imposar cap mena de restricció per ser redistribuïda ni discriminar persones o col·lectius, ha de publicitar el seu codi font i ha de permetre obres derivades. El principal escull que l’organització trobava amb la definició de codi obert dels models Llama de Meta és que no permeten qualsevol classe d’ús comercial, ja que aquelles empreses amb més de 700 milions d’usuaris mensuals havien de demanar una llicència especial a la companyia.
L’actual versió de la definició també indica quins són els preparatius que cal fer per permetre les modificacions d’un sistema d’aprenentatge automàtic de codi obert. Així, l’OSI reivindica que cal oferir prou informació sobre les dades emprades durant l’entrenament del sistema perquè una persona qualificada pugui recrear-ne una porció significativa amb les mateixes dades o similars. Dins d’aquesta categoria entren qüestions com les metodologies i tècniques d’entrenament, les bases de dades que s’han fet servir, com s’ha obtingut aquesta informació o quins processos d’etiquetatge i neteja de dades s’han fet servir. En segon lloc, s’ha de facilitar tot el codi que s’ha usat per entrenar i executar el sistema a través de llicències aprovades per l’OSI, incloent-hi dades preprocessades, validacions i testatges, arquitectura del model o llibreries complementàries que s’hagin fet servir. Finalment, també cal especificar quin pes i paràmetres té el model, tant en el seu estat final optimitzat com en diferents etapes intermèdies considerades claus pels desenvolupadors.