El Projecte Aina presenta el primer model de síntesi de veu que inclou totes les variants del català

El sistema, batejat com a Matxa, es troba en fase de testeig disponible en codi obert en balear, valencià, nord-occidental i català central

Categories:

Redacció

El projecte destaca per la naturalitat de les veus escollides amb el que va ser entrenat el sistema i per tenir un temps d’execució de pocs segons
El projecte destaca per la naturalitat de les veus escollides amb el que va ser entrenat el sistema i per tenir un temps d’execució de pocs segons | Jason Leung (Unsplash)

El Projecte Aina d’intel·ligència artificial (IA) i tecnologies de llenguatge ha presentat aquest dimarts el primer model de síntesi de veu que ofereix la interpretació de text a veu (TTS) en les principals variants dialectals del català. Batejat com a Matxa, inclou el català central, el nord-occidental, el balear i el valencià. Els usuaris ja poden fer les primeres proves en una demo pública on es pot introduir un text, l’accent, la velocitat o la tonalitat del parlant.

El model ha estat desenvolupat amb la tecnologia creada per la Unitat de Tecnologies del Llenguatge del Barcelona Supercomputing Center - Centro Nacional de Supercomputación (BSC-CNS) que s’entrena amb diferents conjunts de dades com el Festcat i l’OpenSLR69, que inclouen enregistraments en les quatre variants de l’idioma del Principat. La primera versió ja es troba disponible a Hugging Face, una comunitat de creadors d’IA que usen el codi obert. 

A l’espera que incorporin també l’aranès, Matxa té com a particularitat que manté la naturalitat i les característiques de cada dialecte perquè les veus escollides han estat pensades per assegurar aquesta qualitat. També presenta un temps d’execució baix a través de les xarxes neuronals, de pocs segons, i ha estat configurat per al superordinador MareNostrum5 i el FinisTerrae III del Centro de Supercomputación de Galicia (CESGA).