Softcatalà inclou l’italià i el neerlandès al traductor al català
L’entitat publica els 14 models lliures de traducció neuronal que millors resultats han donat amb la llengua
Categories:
Softcatalà, l’associació dedicada a fomentar l’ús del català a internet i en les noves tecnologies, ha incorporat dues noves llengües al seu traductor d’arxius de text, l’italià i el neerlandès, que s’afegeixen als idiomes fins ara ja disponibles (l’anglès, el francès, l’alemany i el portuguès). L’entitat també ha millorat els seus traductors del català al francès i al portuguès (i viceversa), implementant una tecnologia neuronal que, asseguren, té una qualitat més alta que el sistema que empraven anteriorment.
Juntament amb les noves llengües de què disposa el traductor de Softcatalà, l’organització ha alliberat al públic els 14 millors models de traducció neuronal que incorporen el català, que es poden utilitzar tant des del web com des dels ordinadors personals. D’acord amb l’associació, l’ús d’aquesta classe d’eines automàtiques permeten reduir el temps “fins a una tercera part”, i asseguren que, sense elles, tindríem “molta menys producció de productes i serveis en català”.
L’entitat sense ànim de lucre també ha publicat dos corpus lingüístics del català a l’anglès que permetran entrenar futurs models de traducció neuronal. El primer d’ells, Europarl, conté 1,9 milions de frases extretes de textos de procediments del Parlament Europeu, mentre que l’altre, Tilde, agrupa més de 3,4 milions d’oracions, en aquest cas extretes de pàgines webs del sector públic. Ambdós corpus han estat traduïts des del castellà amb l’eina Apertium, i el seu ús ha possibilitat la incorporació del traductor al neerlandès, ja que fins aleshores no comptaven amb un corpus suficientment ampli per a crear un model neuronal amb llengües més minoritàries.