El català, entre les llengües ‘top’ en l’entrenament del nou model de traducció automàtica de Google

L’AudioPaLM, capaç de generar text i veu en multitud d’idiomes, es nodreix d’un repositori de veus amb aportacions de tot el món

Redacció

L’AudioPaLM suposarà un pas endavant en les eines de transcripció automàtica
L’AudioPaLM suposarà un pas endavant en les eines de transcripció automàtica | Karolina Grabowska (Pexels)

El català ha tingut un pes destacat en l’entrenament de l’AudioPaLM, el nou model de llenguatge multimodal presentat aquesta setmana per Google i que és capaç de processar i generar tant text escrit com parlat en infinitat d’idiomes. La crida d’entitats com Plataforma per la Llengua va reeixir, i el català comparteix la categoria d’”idioma amb molts recursos” (juntament amb el francès, l’alemany o l’espanyol) dins el repositori mundial de veus anomenat Common Voice utilitzat per ensinistrar l’eina de traducció automàtica.

L’AudioPaLM combina les capacitats de dos models de llenguatge de Google, PaLM-2 i AudioLM, i n’aprofita el fet de capturar elements de comunicació no verbal com ara l’entonació i el timbre de veu del parlant. Fins i tot és capaç de reproduir amb la veu original el missatge traduït, i els seus creadors sostenen que supera, de llarg, els sistemes existents ara mateix.

De moment, l’AudioPaLM és tan sols un desenvolupament tècnic que encara no es pot trobar a cap aplicació d’ús comú, però l’objectiu és que s’acabi implantant en programes per fer traduccions de veu a veu en directe i en el camp del reconeixement de llenguatge parlat i la transcripció automàtica.

Recentment, Google ja va incorporar el català en el model de llenguatge en massa PaLM2, que ja té aplicacions pràctiques en productes com ara el xat conversacional Bard (l’alternativa de Google al ChatGPT) i l’assistent de veu Chirp.