El servei de transcripció d’Amazon incorpora el català
Els algoritmes d’autoaprenentatge usats per entrenar el sistema garanteixen la mateixa precisió de l’eina en les llengües minoritàries, segons afirma la companyia
Categories:
Amazon Transcribe, el servei que permet transformar qualsevol àudio parlat en un text, ha incorporat des d’aquesta setmana una vintena de llengües noves, entre les quals es troba el català. El programa de reconeixement de veu arriba ja als 100 idiomes gràcies a l’entrenament exhaustiu amb milions d’hores d’àudio i emprant algoritmes d’autoaprenentatge que han augmentat la precisió de l’eina, segons ha explicat la companyia.
El sistema de transcripció d’Amazon —de pagament i amb una versió gratuïta de prova que permet convertir 60 minuts de veu cap a text en un any— ha tingut una especial cura de les llengües minoritàries amb l’objectiu que la seva eficàcia no sigui menor respecte les més parlades. El model de base de Transcribe està entrenat utilitzant algoritmes supervisats per si mateixos per aprendre els patrons universals inherents de la parla humana a través de llengües i accents. L'entrenament s'optimitza a través d'un mostreig de dades intel·ligent per equilibrar la quantitat de dades entre idiomes, i que les llengües tradicionalment menys representades no es vegin agreujades.
Els àudios telefònics, per la seva banda, també han millorat la precisió entre el 30% i el 70% i s’han inclòs funcionalitats com ara la puntuació automàtica, vocabulari personalitzat, identificació automàtica de l'idioma i filtre de vocabulari personalitzat. Amazon, a més, explica que l’ampliació i avenç de Transcribe li permet funcionar de manera òptima en entorns de soroll i condicions acústiques complicades.