El 60% de les tecnologies del llenguatge estan disponibles en català
Els sistemes de reconeixement de parla i els models de llenguatge extens són dues de les categories on més creix la presència de la llengua des de 2020
Categories:
La darrera actualització del directori La llengua catalana i les tecnologies del llenguatge elaborat per la secretaria de Política Lingüística de la Generalitat desvela que 177 productes i serveis digitals especialitzats en les tecnologies del llenguatge ofereixen el català entre les seves llengües, xifra que suposa un 60% del total (295). Aquesta dada implica un creixement del 254% sobre l’oferta detectada el 2020, quan només es comptabilitzaven 50 productes, i un increment de 16 punts percentuals respecte al percentatge del total, que aleshores era del 44%.
De les sis especialitzacions que identifica el directori, l’àmbit on més ha crescut la llengua catalana és la de sistemes de reconeixement automàtic de parla (ASR), en què s’ha quadruplicat el nombre de solucions, passat de sis a 25. En aquest camp es troben aplicacions com Microsoft Azure, Google Cloud, Whisper, Amazon Transcribe, Common Voice, Deepspeech Mozilla o el servei de transcripció d'àudio i vídeo a text de Softcatalà. Per la seva banda, dins de la categoria de Sistemes d’interpretació del llenguatge natural, també ha crescut notòriament els projectes vinculats als models de llenguatge extens (LLM per les sigles en anglès), amb productes com ChatGPT4, Llama, Copilot o Claude instant-100k.
D’entre totes les categories identificades al directori, la que ofereix un percentatge més alt de serveis en català és la de subtítols automàtics amb ASR, on de les 19 solucions identificades, totes menys una (Subly) són compatibles amb l’idioma. Aquí s’inclouen productes com Happy Scribe, Vocalmatic, Transcribe o Subtitles Translator, entre altres. Per contra, un àmbit on el català encara no està del tot consolidat és el dels assistents de veu, en què només quatre de les 44 solucions detectades (Mycroft, Rhasspy, assistent.cat i AINA) es poden fer servir en la llengua.