El Projecte Aina presenta el primer model de síntesi de veu que inclou totes les variants del català

El sistema, batejat com a Matxa, es troba en fase de testeig disponible en codi obert en balear, valencià, nord-occidental i català central

Categories:

RedaccióDimarts, 23 d'abril de 2024 | 12:41h

El projecte destaca per la naturalitat de les veus escollides amb el que va ser entrenat el sistema i per tenir un temps d’execució de pocs segons | Jason Leung (Unsplash)

El Projecte Aina d’intel·ligència artificial (IA) i tecnologies de llenguatge ha presentat aquest dimarts el primer model de síntesi de veu que ofereix la interpretació de text a veu (TTS) en les principals variants dialectals del català. Batejat com a Matxa, inclou el català central, el nord-occidental, el balear i el valencià. Els usuaris ja poden fer les primeres proves en una demo pública on es pot introduir un text, l’accent, la velocitat o la tonalitat del parlant.

El model ha estat desenvolupat amb la tecnologia creada per la Unitat de Tecnologies del Llenguatge del Barcelona Supercomputing Center - Centro Nacional de Supercomputación (BSC-CNS) que s’entrena amb diferents conjunts de dades com el Festcat i l’OpenSLR69, que inclouen enregistraments en les quatre variants de l’idioma del Principat. La primera versió ja es troba disponible a Hugging Face, una comunitat de creadors d’IA que usen el codi obert.

A l’espera que incorporin també l’aranès, Matxa té com a particularitat que manté la naturalitat i les característiques de cada dialecte perquè les veus escollides han estat pensades per assegurar aquesta qualitat. També presenta un temps d’execució baix a través de les xarxes neuronals, de pocs segons, i ha estat configurat per al superordinador MareNostrum5 i el FinisTerrae III del Centro de Supercomputación de Galicia (CESGA).

El digital de tecnologia en català

El Projecte Aina presenta el primer model de síntesi de veu que inclou totes les variants del català

El sistema, batejat com a Matxa, es troba en fase de testeig disponible en codi obert en balear, valencià, nord-occidental i català central

Etiquetes

Articles relacionats

Neix l’Aliança AINA amb l’objectiu de potenciar el català a internet i al món tecnològic

L’AINA avança: 128 gigabytes de text i 800 hores de veu en català

El Projecte Aina també desenvoluparà models d’IA en aranès

Etiquetes

Articles relacionats

Neix l’Aliança AINA amb l’objectiu de potenciar el català a internet i al món tecnològic

L’AINA avança: 128 gigabytes de text i 800 hores de veu en català

El Projecte Aina també desenvoluparà models d’IA en aranès

MetaData

El digital de tecnologia en català

Seccions

Categories

Territoris

Cercador