Investigadors de la URV creen un model per identificar els sentiments dels textos de xarxes socials

La nova tècnica mescla tècniques lingüístiques i computacionals per superar la barrera que suposa el llenguatge difús

Categories:

Redacció

La proposta es basa en la gramàtica de propietats i en un model de lògica difusa
La proposta es basa en la gramàtica de propietats i en un model de lògica difusa | Ketut Subiyanto (Pexels)

La comprensió dels sentiments que s’amaguen darrere de textos escrits és una de les barreres més complicades de superar per part de les màquines de processament de llenguatge i intel·ligències artificials, especialment en entorns d’ús massiu i col·loquial com són les xarxes socials. És per aquesta raó que un equip d’investigadors del Departament de Filologies Romàniques de la Universitat Rovira i Virgili (URV) ha dissenyat una tècnica basada en el model de llenguatge difús que combina diversos procediments matemàtics i lingüístics per sortejar les limitacions dels mètodes ja disponibles.

En l’actualitat, les pràctiques més esteses dins l’avaluació del llenguatge valoratiu són els algoritmes d’aprenentatge automàtic i les tècniques de diccionari, també conegudes com a bossa de paraules. El problema d’aquests mètodes és que, segons els investigadors de la URV, no aporten les característiques necessàries des del punt de vista dels processos lingüístics. És per això que els acadèmics proposen un model més interdisciplinari, centrat a analitzar de manera més profunda els matisos de cada enunciat. Per fer-ho, l’equip de la URV es basa en dues tècniques principals: la gramàtica de propietats i un model de lògica difusa. La primera d’elles estableix el marc normatiu que cal complir perquè una estructura lingüística sigui correcta, mentre que el segon és el que s’encarrega de captar la vaguetat de les expressions i el seu grau de positivitat o negativitat.

La recerca s’ha dut a terme en col·laboració amb el centre d’excel·lència IRAFM de la República Txeca i s’ha publicat a la revista científica Mathematics. Els investigadors esperen que el seu model pugui aplicar-se en sectors com la mineria de dades, les eines d’autoaprenentatge de llengües o els detectors automàtics d’autories. Per aconseguir-ho, els acadèmics volen ampliar encara més la multidisciplinarietat del projecte implicant-hi professionals de la psicologia, l’enginyeria computacional, la lingüística o la lexicografia. “Això ajudaria a poder identificar llenguatge violent, i també tindria beneficis per a les anàlisis de dades en el sector serveis, turisme i en la detecció de problemes cognitius en relació amb el nivell semàntic del llenguatge”, explica una de les investigadores en cap de la iniciativa, María Dolores Jiménez.