Els assistents de veu volen parlar en català

La creació i captació d’arxius sonors en la llengua, així com enfortir el diàleg amb els proveïdors de plataformes digitals són els reptes per incrementar l’oferta d’idiomes a la xarxa

Aida Corón

Han sorgit diverses propostes per crear un programari lliure per a solucions de reconeixement de veu en català
Han sorgit diverses propostes per crear un programari lliure per a solucions de reconeixement de veu en català | CC0

L’ús dels assistents de veu en les cerques a Internet no ha deixat de créixer. De fet, la previsió és que aquest 2020 la meitat de les cerques ja emprin la veu, segons un estudi publicat per la consultora Best. Tres quartes parts de la societat a escala mundial ha provat el sistema algun cop i ha donat resultats tan satisfactoris com amb l’escriptura dels termes a buscar gràcies a la intel·ligència artificial i a l’aprenentatge automàtic. Però un cop s’ha superat la barrera tecnològica, cal un requisit més per accelerar-ne la massificació: que parlin l’idioma de l’usuari. És a dir, que parlin el català. I el 89% dels consumidors ha manifestat que vol la seva llengua a solucions com Alexa, Google Assistant, Siri i Bixby, segons un estudi de la Direcció General de Política Lingüística mitjançant l’enquesta Òmnibus de GESOP.

En els últims mesos hem conegut que tant Apple com Google ja s’han posat en marxa, aparentment, amb la incorporació de la llengua en els seus assistents virtuals. La companyia de Cupertino va publicar una oferta laboral per a un analista amb coneixements de català. Aquesta persona és qui ha de treballar amb àudios en la llengua, transcriure’ls i ensenyar a Siri a través de l’aprenentatge automàtic perquè sigui capaç d’entendre un usuari de Catalunya.

Siri i Google Assistant han deixat entreveure que treballen en la inclusió del català

En el cas de Google, es va poder comprovar com l’empresa ha posat en pràctica la capacitat de l’app Assistant per entendre el català. Tot i això, la companyia no ha confirmat ni desmentit que aquest sigui una de les pròximes llengües a incorporar. Consultada per MetaData, ha assenyalat que les noves inclusions lingüístiques es fan amb una “reflexió” prèvia per “estar segurs que els usuaris tindran una bona experiència, divertida i útil”. I recorden que la solució està disponible en 30 idiomes i 80 països, i que continuaran “treballant d’aquesta manera per valorar un nou llançament”.

Dades: primer requisit

El català és la vuitena llengua del món amb més penetració a internet. Nou de cada 10 dels webs més consultats a Catalunya estan en l’idioma propi, set de cada 10 dels programes de missatgeria líders també l’inclouen, i grans plataformes com YouTube han seguit les mateixes passes. Però en el cas dels assistents de veu, malgrat que hi ha una trentena disponible al mercat, és una tasca pendent tot i que Assistant i Siri ja ofereixen el danès o el noruec, amb menys parlants que el català.

Google Assistant i Siri ja ofereixen el danès o el noruec, amb menys parlants que el català

La intel·ligència artificial i l’aprenentatge automàtic han permès que cada cop sorgeixin més solucions basades en la veu, pel que els recursos tecnològics ja no són el principal problema, sinó que un dels deures pendents és augmentar el volum de dades disponibles per dissenyar noves eines.

Un projecte que destaca per posar fil a l’agulla és Common Voice de Mozilla. Mitjançant una crida a la participació ciutadana, pretén crear una base de dades de veus amb llicència oberta en diferents idiomes per servir de base en la creació de programari de reconeixement de la parla. Calen 1.000 hores d’enregistrament d’usuaris amb frases per aconseguir-ho, i el català ha superat ja les 150 després d’una crida per part de la Direcció de Política Lingüística i Softcatalà.

Llançat a escala global el 2017, suma ja més de 1.600 hores validades en l’anglès, la llengua amb més aportacions. La segueix el ruandès (1.200 hores), l’alemany (756 hores), el francès (602 hores) i el català (578 hores). La iniciativa compta amb més de 30 idiomes que reben diàriament aportacions desinteressades per ajudar els programadors i les empreses.

El català és la cinquena llengua amb més hores validades a la iniciativa Common Voice de Mozilla

La cooperativa Col·lectivaT també treballa per portar el català a les solucions de veu. Segons explica el responsable de l’eix de tecnologies de la cooperativa i doctor en astrofísica, Baybars Külebi, ja existeix un sistema de reconeixement de la parla obert i lliure, i ara col·laboren amb el projecte Kaldi/Vosk per millorar els models publicats. A més a més, han llançat una eina de síntesi de veu basada en xarxes neuronals anomenada Catotron, que s’ha convertit en la primera solució amb aquesta tecnologia que integra el català.

Aquest mateix mes de novembre, amb el suport del Departament de Cultura, han organitzat les Jornades de tecnologies lingüístiques lliures en català per, explica Külebi, “enfocar els productes de la parla i crear una comunitat pel desenvolupament d’eines i un assistent virtual obert i lliure”. Part dels resultats d’aquest seguit d’activitats que tindran lloc en remot fins al setembre es convertiran en contribucions per a Mycroft, un assistent per a Linux que usa el llenguatge natural per rebre ordre i executar-les.

Intensificar relacions: segon requisit

En paral·lel a l’augment dels recursos disponibles, les converses directes amb els grans operadors del sector tecnològic és un altre dels aspectes a abordar. En aquest sentit, el passat 11 de desembre de 2018 la Generalitat va acordar impulsar la presència de la llengua a les TIC en una acció conjunta amb diversos departaments i organismes recollits en l’informe El  desenvolupament de la llengua catalana en l’entorn dels assistents virtuals de veu, el qual apuntava la importància de garantir-ne la integració juntament amb altres llengües perquè “esdevingui present en aquests nous ecosistemes i segueixi exercint les seves funcions culturals i socials”.

Una de les principals vies de treball ha estat identificar els principals proveïdors de serveis digitals per mostrar l’interès per la incorporació del català en les seves plataformes, com també donar suport a iniciatives de codi obert i a la promoció d’una indústria pròpia d’aplicacions.