Política Lingüística dona suport a un projecte de recerca per a la traducció automàtica multilingüe

L’objectiu de la iniciativa MWT21 és evitar el pas per llengües intermèdies en traduccions entre idiomes de la mateixa família

Categories:

Redacció

L'estudi, recolzat per Política Lingüística, està impulsat pel Centre Alemany de Recerca en Intel·ligència Artificial (DFKI)
L'estudi, recolzat per Política Lingüística, està impulsat pel Centre Alemany de Recerca en Intel·ligència Artificial (DFKI) | @llenguacatalana

La Direcció General de Política Lingüística de la Generalitat de Catalunya ha anunciat aquest divendres el suport al projecte de recerca MWT21, destinat al desenvolupament compartit de traductors automàtics entre llengües d’una mateixa família a través de la intel·ligència artificial. L’objectiu d’aquesta iniciativa, liderada pel Centre Alemany de Recerca en Intel·ligència Artificial (DFKI), és no haver de recórrer a terceres llengües amb més recursos, com l’anglès o el castellà, en els processos de traducció.

El programa liderat per DFKI en col·laboració amb l’European Language Resource Coordination (ELRC) consta de dues fases. En primer lloc s’estudiaran les traduccions automàtiques entre tres llengües nord-germàniques, l’islandès, el noruec bokmål i el suec, dels abstracts i descripcions de treballs publicats a la biblioteca digital europea Europeana. Paral·lelament, s’investigaran els processos de traducció d’articles de patrimoni cultural de la Viquipèdia redactats en català a l’occità, el romanès i l’italià.

El fi d’aquest estudi consisteix a verificar si són necessàries llengües com l’anglès o l’espanyol per tal d’obtenir resultats d’alta qualitat. Això es deu al fet que els models de traducció automàtica multilingüe solen ser entrenats des de l’anglès o cap a l’anglès, que és l’idioma amb més dades disponibles. Si s’acaba determinant que cal utilitzar llengües intermediàries en aquests processos, el següent pas del projecte de recerca és determinar quina és la manera més eficaç de fer-ho, atès que existeixen diverses metodologies disponibles, tals com la traducció en cascada, el sistema de pivotatge en una altra llengua o el preentrenament.