Catotron es renova per impulsar la síntesi de veu en català

El motor lliure basat en xarxes neuronals canvia d’arquitectura per millorar la seva computació

Categories:

Redacció

El nou model de Catotron és capaç de sintentitzar frases més llargues en català
El nou model de Catotron és capaç de sintentitzar frases més llargues en català | Cedida

La cooperativa Col·lectivaT ha presentat una versió millorada de Catotron, el primer sistema de síntesi de veu en català basat en xarxes neuronals. La nova arquitectura del model, basat en programari lliure, permet una computació més eficient i és capaç de sintetitzar frases més llargues, i ha estat desenvolupat en col·laboració amb investigadors de la Universitat Pompeu Fabra i la Universitat Politècnica de Catalunya. Segons expliquen en un comunicat de premsa, aquesta tecnologia obre “una infinitat d’oportunitats tant econòmiques com socials per poder fer parlar català qualsevol dispositiu o aplicació d’una forma molt poc costosa”.

D’acord amb l’InformeCAT 2020, elaborat per la Plataforma per la Llengua, cap dels assistents de veu disponibles actualment al mercat, entre els quals destaquen Alexa o Siri, incorpora el català en els seus dispositius. És per aquest motiu que neixen projectes com Catotron, el projecte Aina o l’assistent de veu Mycroft, iniciatives que busquen potenciar la presència de la llengua en les tecnologies de veu.

Segons explica la companyia a MetaData per correu electrònic, l’equip està utilitzant una tecnologia desenvolupada per Coqui, una empresa formada per extreballadors de l'equip de machine learning de Mozilla, especialitzada en tecnologies lliures de la parla. L’anterior model de Catotron funcionava amb els repositoris de Tacotron2 i WaveGlow, creats per NVIDIA i publicats amb llicències obertes a Github.