“La revolució tecnològica ha de ser per una igualtat lingüística i no per tenir encara més desigualtat”
Mireia Farrús Cabeceran Investigadora en lingüística computacional i professora de la Universitat de Barcelona
Categories:
La democratització de la intel·ligència artificial ha fet molt clar a escala d’usuari que la informàtica i la llengua poden anar de bracet. La ciència que s’hi dedica de ple és la lingüística computacional, una disciplina que es basa a entendre i replicar el llenguatge humà mitjançant la tecnologia en aplicacions com la traducció automàtica o la generació de textos. “El seu punt d’unió són els formalismes”, assenyala la física, investigadora i professora de la Universitat de Barcelona (UB) Mireia Farrús Cabeceran, una de les veus de referència en el camp a casa nostra. “Tant les matemàtiques com la gramàtica són una manera de descriure el món amb formalismes. Uns són més abstractes, però descriuen fenòmens naturals. Tenen en comú unes estructures lògiques rere el pensament, busquen representar el llenguatge humà a través de fórmules matemàtiques, i això és el que més m’agrada”, comenta.
Al llarg de la seva carrera, ha estat vinculada a la Universitat Politècnica de Catalunya (UPC) i al Barcelona Supercomputing Center (BSC). Ha col·laborat en el desenvolupament d’eines aplicades a la salut, l’accessibilitat i la normalització del català en l’àmbit digital, camps en què ha vist com l’arribada massiva de la IA ho ha revolucionat tot.
Primer va estudiar Física; després, Lingüística. Com va descobrir tot aquest món?
Estudiant. No ho coneixia quan vaig fer Física i m’ho vaig trobar més tard, quan vaig entrar a estudiar lingüística perquè m’agradava molt la part de les estructures lògiques. Aquí vaig fer una assignatura de lingüística computacional que em va encantar, vaig fer després una segona part amb una optativa. Llavors, vaig anar a Alemanya a treballar-ho amb més profunditat en un centre de recerca. Aquí és quan vaig descobrir, com que tenia coneixements de física i la programació m’agradava, tota aquesta part més simbòlica.
Va haver de marxar per estudiar-ho a fons perquè aquí no estava desenvolupat. En tornar, havia millorat?
No. Aquí tot es limitava a assignatures d’una carrera, quan allà tenien una llicenciatura pròpia en lingüística computacional. Tota una carrera només per estudiar això.
“Siri, Alexa i ChatGPT ja han entrat en la terminologia popular”
I ara com estem?
Justament ara soc professora de la primera assignatura que vaig fer en aquell moment. I ara, a més a més, s’han reduït les assignatures i en tenim només una. El que passa és que sí que hi ha, per exemple, més programació i més coneixement de tot el que es mou. En el camp de la informàtica, hi ha més coneixement en els temes de tecnologies de la llengua; i un lingüista té una mirada més àmplia ara del que es fa amb lingüística computacional que llavors. També perquè se'n parla molt, perquè ara hi ha la Siri, l'Alexa, el ChatGPT, que són coses que ja han entrat en la terminologia popular. Quan fa 20 anys parlava de la lingüística computacional, ningú sabia de què parlava. Però ara, quan dius que és que fan l'Alexa i el ChatGPT, la gent de seguida ho situa.
Aquestes eines han donat a la llengua un paper clau en la tecnologia?
Sí, totalment. El que passa és que hi ha una tendència en el món de la informàtica d'intentar prescindir del que és el coneixement lingüístic. Moltes vegades aquests sistemes que es basen en intel·ligència artificial intenten prescindir del coneixement lingüístic i arriba un moment en què es veu que és necessari per continuar avançant. També perquè la mirada de la lingüística et dona una visió que un informàtic no sempre pot tenir, com un nivell més discursiu o més pragmàtic. Un informàtic no té per què tenir-los presents a l’hora de desenvolupar un sistema que sigui més natural i més humà.
Ens caldria més lingüistes amb coneixement de programació?
Sí, ens calen lingüistes amb molts coneixements de programació. No cal que programin com un informàtic, però que sí que sàpiguen fer un codi bàsic i, com a mínim, entendre'l. Potser tu no ets un programador de nivell, però saps agafar un codi fet i modificar-lo, i adaptar-lo a les necessitats que tens. Això ja permet fer moltíssimes coses i no requereix saber codi des de zero.
“Ens calen lingüistes que sàpiguen fer un codi bàsic i, com a mínim, entendre’l”
Ara se’n parla molt de la lingüística computacional, però tenim traductors automàtics des de fa anys i la tecnologia s’empra de fa temps.
Han sortit moltíssimes coses abans del ChatGPT, però realment ho ha revolucionat tot per la quantitat de dades que utilitza i per la precisió que dona. Més que precisió, per les respostes que dona. Estem molt acostumats a la resposta d'un cercador com Google, molt més breu, i de cop i volta ens trobem amb ChatGPT que sembla que parli de veritat. Sistemes d'aquests n'hi ha hagut des dels anys 60 i 70. El primer va ser ELIZA i en aquella època era molt impressionant. Ara és molt bàsic i no fa res, però en aquell moment va causar la mateixa sensació perquè no es coneixien totes aquestes tècniques. Tot ha evolucionat de cop, però no sé si també ha sigut una operació de màrqueting. ChatGPT és una proposta desenvolupada per OpenAI, que va comprar Microsoft, i aquí ja va començar una guerra freda. Ara Google, Meta i Amazon també volen treure el seu sistema i competir. Aquesta guerra freda tecnològica fa que se li doni més visibilitat a l'aparició de tots aquests sistemes. Quan va sortir Google Translate, no hi havia aquesta guerra de gegants, no va ser tan impactant. Per a mi, és una operació de màrqueting molt gran que ve de les mateixes empreses.
Guerra tecnològica i econòmica? Quin impacte social té tot plegat?
Tot té impacte, però alhora no en té. Quan hi va haver la revolució industrial, tothom havia de quedar-se sense feina, i aquí som. Quan va començar a sortir la traducció automàtica, recordo un dels primers congressos sobre el tema, deu fer cosa de fa 25 anys. En una xerrada, em van preguntar si desapareixerien els traductors humans. Vaig dir que no, i aquí som, que tenim les facultats de traducció amb més gent fins i tot que abans perquè fan funcions diferents. Un traductor automàtic pot traduir milers de documents, però un humà em dona una qualitat i una identitat que un traductor automàtic no dona. Per tant, al final hi ha una part pragmàtica i d’ambigüitat que la dominem com a humans perquè coneixem el llenguatge. A nivell tecnològic, els sistemes s'aniran a aproximant, però no sé si mai arribaran a la consciència que té un humà. A mi em preocupen més els temes de privacitat i de seguretat, de les dades que es treuen de nosaltres sense permís i que acabem utilitzant per desenvolupar aquestes eines. Parlo de correus electrònics i de dades que poden ser molt sensibles, i també de la part ètica que hi ha darrere aquests sistemes. És a dir, per generar aquests sistemes, necessitem grans quantitats de dades. Parlem de centenars de milers d'hores quan són dades de veu, i milions i milions i milions de textos. Això ha de sortir d'algun lloc i han de ser dades de qualitat. I després qui i com les filtra? Hauríem de veure les condicions humanes, perquè aquí darrere hi ha humans que treballen amb una condició molt precària. Se’n parla molt del ChatGPT, però poc del que hi ha darrere. I a nivell lingüístic, quan necessites tantíssimes dades, què passa? Que de 6.000 llengües que hi ha al món aproximadament, n'hi ha 10 que tenen moltes dades, i tota la resta en tenen poques. El ChatGPT treballa sobretot amb les 100 llengües que tenen més presència a internet. Tenim la sort que català és una d'aquestes, però més per voluntat dels catalans, perquè sempre ens ha agradat molt contribuir a internet. Vam ser dels a crear continguts a la Viquipèdia! Som molt actius, i això ens ha ajudat a tenir visibilitat, però al final, després del català, hi ha milers de llengües que estan sense recursos i no tenen aquesta presència. Sí que hi ha tècniques per desenvolupar eines en altres llengües amb menys recursos, però tot s'ho acaben emportant tot les tres o quatre llengües principals. Aquesta revolució tecnològica ha de ser per una igualtat lingüística i no per tenir encara més desigualtat. Però aquí no només és un problema tecnològic de quantitat de dades, sinó polític. Al final, el més determinant és si la llengua té un estat que li dona suport en el desenvolupament tecnològic o no. En el cas del català, com a habitants, creem molts continguts i moltes dades, però no tenim un estat al darrere que doni suport a la llengua com la seva prioritat. I això passa amb la majoria de les llengües, no només amb el català. No és perquè el català tingui pocs parlants, perquè les llengües nòrdiques tenen més o menys els mateixos parlants que nosaltres, però tenen un estat al darrere que els dona suport. Això és decisiu.
“Hi ha tècniques per desenvolupar eines en altres llengües amb menys recursos, però tot s'ho acaben emportant tot les tres o quatre llengües principals”
“El més determinant és si la llengua té un estat que li dona suport en el desenvolupament tecnològic o no”
A Catalunya tenim la problemàtica de l’ús del castellà per sobre del català, però també tenim el projecte Aina. Com hi està ajudant?
És molt important, sobretot en la part de producció i de conscienciació entre la població. Amb el projecte Aina, la Generalitat ha fet difusió, però al final tot és una redirecció al Common Voice de Mozilla Firefox, que fa molts anys que existeix. Aina també té molta repercussió en termes de finançament per al BSC, que està fent molt bona feina, però la meva crítica és que s'estan oblidant dels grups de recerca que fa molts anys que treballen amb això i que continuen treballant en condicions bastant precàries. Tot s'ho emporta la mateixa entitat. Però fa bona feina, i era molt important que es fes això i que es donés aquest impuls.
Tota la feina feta fins ara ha vingut per part dels grups de recerca i projectes socials?
Sí, s’ha picat molta pedra. Als grups de cerca ens ha tocat perdre, perquè quan demanem recursos econòmics, sobretot a través de finançament europeu i espanyol, sovint el català perd presència. És molt difícil justificar que vols fer una cosa amb finançament espanyol si no hi poses el castellà. Sempre ha sigut una lluita per colar el català per on sigui i per no acabar a la zona de confort, que és treballar amb el castellà i l’anglès. Aquí hem vist moltes iniciatives de grups de recerca i d’associacions com Softcatalà, que han fet una feina impressionant. No només han fet la part de programari, sinó que ara també desenvolupen eines basades en xarxes neuronals que intenten estar a l'última també en tecnologia aplicada al català.
Tenim els grups de treballs i les associacions, però també l’aportació voluntària de la ciutadania per generar dades.
Tot i això, costa que les grans companyies abracin el català.
És molt important l’aportació dels voluntaris lingüístics, tant en dades com en temps. S’han incrementat les dades i les hores de veus enregistrades, però també les varietats de veus i de dialectes. Però tenir les dades és només el primer pas, després ens topem amb la barrera política i que les empreses entenguin que a Catalunya parlem en català, encara que entenguem el castellà. Tenim dret a tenir aquestes eines en la nostra llengua, i no només és un dret com a parlants, sinó per a la preservació de la riquesa cultural que ofereixen les llengües minoritàries. Això costa d’entendre, perquè una comunitat amb pocs parlants no veu tants diners com una comunitat amb més parlants. Aquí hi ha un tema econòmic i un de polític, que és la barreja final que intervé en el desenvolupament d’aquestes eines.
“Als grups de cerca ens ha tocat perdre, perquè quan demanem recursos econòmics, sobretot a través de finançament europeu i espanyol, sovint el català perd presència”
Com definiries el moment en què es troba el català a la xarxa?
Diria que es troba amb més bona salut que el català al carrer, perquè contribuïm molt a internet, però tenim una autoestima molt baixa a escala social. Aquest vici de canviar constantment a la llengua majoritària ens fa molt mal, i és un contrast amb què fem després a les xarxes. Això pel que fa a la creació de continguts, després a banda hi ha el factor de monetitzar a YouTube, Instagram i altres plataformes. Una cosa és que creïs contingut voluntàriament; una altra, que t’hagis de guanyar la vida amb el que crees. Hi ha gent que té molt clar que ho pot aconseguir en català; hi ha gent en català no se n'acaba de sortir; i hi ha gent que ni tan sols ho intenta i tria anar a un mercat amb una llengua majoritària. És un tema delicat i en què entra en joc el sou.
Caldria donar suport a aquests creadors per garantir la normalització del català a l’entorn tecnològic i digital?
Per descomptat! Tot i que cal veure la diferència entre tenir eines de traducció i assistents virtuals en la teva llengua, i tenir continguts. Les xarxes socials i internet són un entorn crític perquè canvien molt els adolescents. Molts han adoptat el castellà perquè estan envoltats de continguts en castellà i és el que comparteixen amb les seves amistats. Si han de parlar si han de parlar d'un joc que només és en castellà, acaben parlant potser en català, però tota la terminologia és en l'altra llengua. Aquí sí que hauríem de vigilar. Falta més consciència, però també ha de venir dels adults. Si nosaltres constantment canviem de llengua, el nostre fill, quan tingui 15 anys, també canviarà de llengua. Aquesta consciència que en català ho podem fer tot és el que ens falta per tenir qualitat lingüística.
“Per a les llengües minoritàries, és crucial que hi hagi recursos de codi lliure i oberts, perquè et donen sobirania tecnològica”
Per això defenses la sobirania tecnològica.
Sí, i per això són tan importants projectes com el de l'Aina i el Common Voice. Són projectes amb codi lliure, que vol dir que a tothom se'n pot beneficiar. Quan ets una llengua majoritària, tens recursos lliures i els que vulguis, però quan ets una llengua amb menys parlants, te’n falten. Si aquests recursos són comercials, moltes vegades no pots accedir-hi, i si no són oberts, no els pots modificar i no els pots adaptar. Per tant, per a les llengües minoritàries, és crucial que hi hagi recursos de codi lliure i oberts perquè et donen sobirania tecnològica. Et permet crear tu els teus recursos tecnològics i no dependre de les grans tecnològiques que tan aviat com posen el català, el poden treure. Tenir els nostres propis recursos és molt important per a l’autogestió.
A la UB esteu desenvolupant Scribal, en què consisteix?
Scribal surt de la necessitat de desenvolupar eines de reconeixement de la parla de tecnologia punta en català. El sistema està basat en Whisper, desenvolupat per OpenAI, i amb una precisió molt alta. Nosaltres hem agafat aquesta tecnologia de codi lliure, que ja estava en català, i l’hem adaptat perquè tingui més qualitat i s’adapti als diferents dialectes que tenim. Això respon a dues necessitats de la universitat. La primera, tenir aquesta eina a les aules per ajudar les persones amb dificultats auditives. Si algú no hi sent bé i pot tenir el contingut transcrit, té accés a la informació que dona el professor. Però de persones amb dificultats auditives n’hi ha poques a cada aula, així que li podem donar un segon ús més genèric per mantenir el català a les aules. Si hi ha un nouvingut, sempre tenim la polèmica de quina llengua utilitzar. Si tens una eina que transcriu el que diu el professor, podem traduir-ho i donar-li sortida en diferents llengües: castellà, anglès, xinès... El professor no tindrà la necessitat de canviar de llengua, es podrà expressar amb la seva pròpia llengua i garantir que s’utilitza la llengua pròpia de les universitats catalanes. El Whisper funcionava molt bé en català central, però no funcionava bé amb el balear i el valencià, i nosaltres li hem donat aquest reforç. Ara estem intentant aconseguir finançament perquè això pugui ser una aplicació que s’instal·li fàcilment als ordinadors de les aules. Un cop tinguem això, ens agradaria que es pogués exportar a totes les universitats de parla catalana i a les escoles, empreses audiovisuals, centres de salut i espais on aquesta eina pugui ser útil tant per a la transcripció, com per a la subtitulació.
“Si l'ús social baixa, la gent no tindrà necessitat d’utilitzar aquestes eines en català”
Si hagués de fer una predicció d’aquí a 10 anys, en quina situació posaria el català a l’entorn tecnològic i digital?
Una cosa és una predicció i una altra, un desig. Crec que a nivell tecnològic anem bé i tindrem eines que ens ajudaran molt. Em preocupa més la part social, el català al carrer i la disminució de l'ús social del català. Si l'ús social baixa, la gent no tindrà necessitat d’utilitzar aquestes eines en català. Jo crec que d'aquí a 10 anys seran molt potents, però la gent les ha de necessitar i les ha de voler utilitzar. Si no hi ha ús social, aquestes eines no serveixen per a res.