SignGemma, l’eina de Google que facilita la comprensió de llengua de signes

La plataforma del gegant tecnològic és el resultat de 10.000 hores d’entrenament visualitzant vídeos i, ara per ara, treballa només en anglès

Redacció

Detectant i processant el moviment amb les mans i els llavis pot oferir una traducció directa i en temps real als usuaris
Detectant i processant el moviment amb les mans i els llavis pot oferir una traducció directa i en temps real als usuaris | Google

Google ha presentat un nou model de codi obert que tradueix la llengua de signes a text directament als dispositius. SignGemma, desenvolupat per Google DeepMind, ha començat a treballar en la llengua de signes anglesa i l’anglès, tot i que la previsió és que en els pròxims mesos s’afegeixin altres idiomes. Aquesta nova eina és el resultat de 10.000 hores d’entrenament en format vídeo, conjuntament amb un gran volum de transcripcions.

La plataforma, que pertany als models de codi obert Gemma, treballa amb intel·ligència artificial (IA) multimodal i permet que es pugui activar sense connexió a la xarxa. Per altra banda, està equipada amb un transformador de visió, que detecta i processa el moviment de les mans i els llavis per oferir una traducció directa i en temps real.

SignGemma es va presentar en el congrés de Google I/O 2025, on també es van mostrar els avenços en altres eines com Google Beam, que transforma els vídeos en 2D en experiències en 3D; o Flow, que pot crear clips cinematogràfics i allargar peces audiovisuals curtes. En aquest cas, la plataforma de llengua de signes està en fase proves i compta amb la participació de desenvolupadors, investigadors i la comunitat de persones amb dificultats auditives.

Etiquetes