Enginyer d’IA i emprenedor tecnològic.
IA, codi obert i qui té realment el control
“Sense codi obert, els models d’IA es converteixen en caixes negres controlades per unes poques empreses.”
No hem d’oblidar una cosa fonamental: quan parlem d’intel·ligència artificial, no estem parlant de màgia. Estem parlant de màquines de completar text. Molt sofisticades, sí. Però, al final, màquines de completar.
Quan li preguntes a una IA “El cel és…”, et respon “blau”. No perquè tingui ulls. No perquè entengui què és el blau ni què és el cel. Ho fa perquè ha vist milers, milions de vegades, que “blau” és la paraula més probable que ve després de “El cel és”.
Això és tot. Probabilitat.
Quan tenim això clar, la següent pregunta a fer-se és automàtica: com sap quina és la paraula més probable? La resposta són els famosos pesos. I aquí és on la cosa es torna menys màgica i més… matemàtica. Un model d’IA no deixa de ser una pila enorme de números. Literalment. Números que formen part d’equacions matemàtiques gegants, guardats en fitxers que poden pesar desenes o centenars de GB. Quan fas una pregunta, el model no “pensa”: calcula.
“La IA no pensa ni entén: calcula quina és la paraula més probable a partir de milions de patrons apresos.”
Models com ChatGPT o Claude són, en essència, això: una arquitectura matemàtica molt ben afinada i una quantitat absurda de números ordenats amb molt criteri. I llavors arriba la pregunta clau: “si jo tingués tots aquests números… podria tenir el model a casa?” La resposta és simple: sí (assumint que tinguéssim prou maquinari, està clar). I aquí és on entren en joc els incentius.
Les empreses que desenvolupen aquests models saben perfectament que, si publiquen aquests pesos, perden una part molt gran del seu avantatge. Perquè els models es poden copiar. Es poden adaptar. I, el que és més important: es poden millorar. Aquí apareix el codi obert.
“Sense codi obert, els models d’IA es converteixen en caixes negres controlades per unes poques empreses.”
El codi obert, en essència, és fer públic com funciona un sistema perquè qualsevol el pugui veure, entendre i —en certa manera— reutilitzar. Amb el programari tradicional és bastant directe: publiques el codi i algú pot replicar el teu producte. Amb la IA és similar, però amb més capes. A mi m’agrada pensar-ho en tres nivells:
Pesos oberts: Si tens els pesos, pots executar el model. Sense internet, sense dependències, sense proveïdors. El model és teu.
Pesos + “paper” obert: El “paper” és la recepta, com s’ha entrenat el model. Arquitectura, optimització, decisions tècniques. Amb això, ja no només el pots usar —el pots reproduir.
Pesos + paper + dades: Aquest és el nivell màxim de transparència. Saber amb què s’ha entrenat el model. No només com funciona, sinó d’on ve el seu coneixement.
I aquí és on el debat es posa interessant. Perquè el codi obert en IA no és només una qüestió tècnica. És una qüestió de control. Quan treballes amb models propietaris, estàs construint sobre una caixa negra. Una caixa que pot canviar de preu, de comportament o de condicions d’un dia per l’altre.
“Quan treballes amb models oberts, no només utilitzes tecnologia: també recuperes capacitat de decisió, adaptació i control.”
Quan treballes amb models oberts, tens opcions. Pots adaptar, optimitzar, auditar. Pots decidir. Això no vol dir que tot hagi de ser obert. Però sí que vol dir que, sense codi obert, no hi ha equilibri. Perquè, al final, els models propietaris no estan alineats amb tu. Estan alineats amb els interessos de qui els controla. I en una tecnologia que cada cop té més impacte en com treballem, decidim i entenem el món… potser això és massa important per deixar-ho en mans d’uns pocs.