Softcatalà estrena un nou servei de doblatge automàtic de vídeos en català

L’eina, encara en fase de proves, permet traduir continguts de l’anglès o el castellà i editar-ne el text en cas que hi hagi errors

Categories:

Redacció

El servei fa servir tecnologies de reconeixement de veu, traducció automàtica i síntesi de veu basades en intel·ligència artificial i pot contenir errors
El servei fa servir tecnologies de reconeixement de veu, traducció automàtica i síntesi de veu basades en intel·ligència artificial i pot contenir errors | Vadim Artyukhin (Unsplash)

Softcatalà ha anunciat el llançament de la seva nova eina de doblatge automàtic de vídeos en català, un servei d’accés gratuït i en fase de proves que permet posar veus sintètiques en la nostra llengua a continguts que originalment es trobaven en castellà o anglès. El nou programari de l’entitat empra tecnologies de reconeixement de veu, traducció automàtica i síntesi de veu, totes elles basades en intel·ligència artificial.

El funcionament de la nova eina de Softcatalà és similar a la dels altres serveis de l’associació, com pot ser el transcriptor de fitxers d’àudio o vídeos a text, ideal per crear subtítols en català. L’únic que cal fer és pujar el fitxer de vídeo (només admet el format mp4 i una mida màxima de 2 GB o una durada de 60 minuts) i especificar l’idioma d’origen (castellà o anglès, o bé deixar que el detecti automàticament), l'adreça de correu on s’avisarà dels resultats i la variant dialectal del doblatge desitjat (balear, valencià, central o nord-occidental). Quan el doblatge estigui fet, l’eina ens enviarà per correu un enllaç des d’on podrem veure’n el resultat. El visualitzador anirà acompanyat de la transcripció textual que el programari converteix en veu, el qual podrem editar, sigui modificant paraules o traient frases, per assolir un resultat satisfactori.

Per desenvolupar la nova eina, l’equip de Softcatalà ha fet servir Whisper pel reconeixement de la parla, el model Matxa del Projecte Aina per la síntesi de veu, pyannote per la identificació del parlant, demuc per la separació de la parla, audeering pel reconeixement del gènere del parlant, nmt-softcatala per la traducció anglès-català, Apertium per la traducció castellà-català, open-dubbing pel sistema de doblatge automàtic i subdub-editor per a l’edició del resultat final. Des de Softcatalà alerten que el servei és encara experimental i que cadascuna de les fases poden generar errors inesperats, entre els quals els més habituals són les paraules mal traduïdes i fragments d’àudio que no apareixen en l’original. L’entitat deixa clar que aquesta eina “no substitueix la figura dels professionals del doblatge”, sinó que vol oferir una alternativa per “facilitar la generació de continguts quan el recurs a professionals no sigui una opció”.