Araina, la iniciativa perquè la tecnologia entengui l’aranès
El moviment s’inspira en el Projecte AINA i ja ha aconseguit recollir més de vuit hores d’enregistraments d’un centenar de voluntaris
Categories:
Les tecnologies de veu són cada dia més presents en el nostre dia a dia, però perquè aquests dispositius ens entenguin en la nostra llengua calen grans quantitats de dades per entrenar els algoritmes que les operen. En català, el Projecte AINA lidera la creació dels corpus lingüístics en text i veu, i inspirats per la seva feina la cooperativa Col·lectivaT ha impulsat el Projecte Araina, una iniciativa que busca recollir crear datasets per potenciar l’aranès en el món digital.
Per tal d’impulsar la participació de la ciutadania, el Projecte Araina va celebrar el passat 17 de desembre una marató de veus al Conselh Generau d’Aran a Vielha, on va aconseguir recaptar un total de vuit hores enregistrades amb la participació d’un centenar de voluntaris, que van llegir fins a 4.000 frases.
De la mateixa manera que el seu equivalent català, el Projecte Araina promociona l’ús de Common Voice per crear un corpus lingüístic de veu en aranès, on ara mateix disposa d’una hora d’enregistrament validada. Les frases que els usuaris poden llegir s’han extret d’obres literàries clàssiques traduïdes per Antòni Nogués. Tanmateix, la iniciativa també està present a ReVOc, un portal de característiques similars, però centrat únicament en la llengua occitana i els seus dialectes.