Desenvolupen un sistema de traducció automàtica neuronal d’articles científics

La tecnologia passa de l’anglès a l’espanyol els estudis centrats en la covid-19 a una velocitat de fins a 10.000 paraules per segon

Categories:

Redacció

El sistema ha après a classificar els documents amb un entenament previ de categorització elaborat per experts
El sistema ha après a classificar els documents amb un entenament previ de categorització elaborat per experts | CC0

Un equip d'investigadors de la Universitat Oberta de Catalunya (UOC) ha desenvolupat una tecnologia per traduir els resums de 15.000 articles científics sobre la covid-19 de l’anglès a l'espanyol per facilitar l'accés a aquesta informació al personal mèdic de l'Hospital Universitari Vall d'Hebron de Barcelona. El sistema es basa en una traducció automàtica neuronal entrenat per al domini mèdic i adaptat a les temàtiques relacionades amb el coronavirus.

La solució tradueix entre 100 i 10.000 paraules per segon, en funció de l’ordinador on s’executi. “El procés de traducció automàtica, més l'edició posterior, pot arribar a ser entre quatre i cinc vegades més ràpid que la traducció humana, i assolir nivells de qualitat molt semblants”, assenyala Antoni Oliver, membre del Grup de Recerca Interuniversitari en Aplicacions Lingüístiques (GRIAL) dels Estudis d'Arts i Humanitats de la UOC.

El sistema ha après a classificar els documents amb un entenament previ de categorització elaborat per experts

Per a aquest projecte, altres equips de recerca participants fan servir tècniques d'intel·ligència artificial per detectar els articles científics que són rellevants sobre la covid-19. “Primer van fer una classificació manual d'un gran conjunt de documents i, a partir d'aquesta categorització, el sistema ha après a classificar els documents”, explica Oliver. El seu sistema recupera els articles científics de la compilació de Science Direct d'Elsevier, una editorial neerlandesa de publicacions científiques, i també de fons com LitCOVID, un portal de recursos oberts de la Biblioteca Nacional de Medicina dels Estats Units, que dona accés a una de les col·leccions més completes de treballs de recerca de tot el món sobre la nova malaltia, amb més de 28.000 publicacions actualment.

Col·laboració internacional

La iniciativa compta amb col·laboracions internacionals i entre els seus objectius s'inclou l'impuls d'un repositori d'articles científics sobre la malaltia a la Universitat Nacional Autònoma de Mèxic (UNAM), així com una plataforma similar hostatjada al Vall d'Hebron. A més de la UOC i l'Hospital, hi participen l'Agència de Qualitat i Avaluació Sanitàries de Catalunya (AQUAS), el Centre de Ciències Genòmiques de la UNAM, una investigadora de l'Institut Nacional de Malalties Respiratòries de Mèxic i una altra del suís Istituto Dalle Molle di Studi sull'Intelligenza Artificiale (Dalle Molle Institute for Artificial Intelligence Research), a més d'un doctorand de la Universitat Politècnica de Catalunya.