Quan el pòdcast ja és territori de la intel·ligència artificial

‘Relatos sintéticos’ és una proposta de terror creada en un 70% per la tecnologia d’OpenAI i en un 30% per humans

Categories:

Aida Corón

La intel·ligència artificial crea el relat, la veu i les imatges del pòdcast 'Relatos sintéticos'
La intel·ligència artificial crea el relat, la veu i les imatges del pòdcast 'Relatos sintéticos' | DALLE.cat

La intel·ligència artificial s’ha convertit en una de les tecnologies de l’any. En pocs mesos, hem vist com els algoritmes escrivien relats, mantenien una conversa o eren capaces de crear postals i cançons creatives. Ara els tecnòlegs també s’han atrevit amb el pòdcast. O potser no caldria especificar experts en tecnologia, ja que la companyia de màrqueting i consultoria Prodigioso Volcán ha creat un producte de tres capítols narrat, escrit i il·lustrat per màquines. Relatos sintéticos, nom que rep la proposta d’entreteniment, es basa en una història de terror i només un 30% de tota la feina l’han executat persones reals, sobretot en tasques de revisió i correcció.

La tecnologia de base són els algoritmes de GPT-3 en obert, producte de la companyia OpenAI propietat d'Elon Musk. Aquesta intel·ligència artificial està especialitzada en l'aprenentatge del llenguatge, de manera que després d'un entrenament exhaustiu en tota mena de llengües, és capaç d'elaborar un text amb la mateixa coherència que ho faria un humà. No perfectes, però sí seguint uns criteris d'escriptura i ordre que permeten tenir "un resultat satisfactori", apunta la responsable d'IA i Dades a Prodigioso Volcán, Carmen Torrijos.

El primer pas per obtenir el pòdcast ha estat oferir dues línies de text a l'eina perquè s'encarregués ella sola de desenvolupar tot el relat. "En alguns casos li hem donat els personatges, mentre que en d'altres ha estat l'inici de la trama o el plantejament del relat de manera superficial", explica l'experta, "a través del resultat aconseguit, el nostre equip ha acabat de tancar el final perquè, en aquest punt, la tecnologia no ho acaba de fer del tot bé". Seguidament, s'ha locutat i enregistrat el text per tenir el material propi d'un pòdcast amb veus robòtiques, excepte la presentació, que ha anat a càrrec d'una persona. "Les veus triades són úniques, han sorgit d'imitar moltes altres veus diferents per saber com pronunciar cada fonema, tot i que encara que hi ha limitacions en l'entonació i la prosòdia", comenta.

‘Relatos sintéticos’ s’ha creat amb eines d’OpenAI per crear el relat, les veus i les imatges del pòdcast

La part gràfica composta per les imatges de la plataforma han estat elaborades amb DALL·E, també d'OpenAI, però especialitzada en la producció gràfica. En aquest cas, els termes emprats per obtenir les fotografies que il·lustres Relatos sintéticos són relato de terror i calabaza calabuig.

Unir esforços entre humans i IA

Tot el procediment va durar al voltant de 24 hores, un termini que redueix dràsticament les hores que hi ha de dedicar un equip d'experts. Això obre el debat sobre la possible substitució de la creativitat humana per màquines, especialment si la tecnologia avança fins al nivell d'assolir uns resultats que freguin l'excel·lència. Però no tot el que llueix és or, sinó que Torrijos alerta que cal diferenciar objectius: "La IA no pot treballar sola, necessita darrere seu la mà humana. I el sistema tampoc és útil en novel·les, només en relats curts, on hi ha menys marge a les incoherències. Aquesta és una prova per comprovar quant triga la màquina en comparació en l'home, i per veure què es pot obtenir del treball conjunt entre els dos". Traslladar aquest sistema a la creació d'un llibre llarg podria fer que els lectors recuperin de cop i volta un personatge que ha mort, per exemple, causat per "la falta de memòria narrativa dels algoritmes".

El 30% de la feina s’ha fet per humans, que han acabat de donar coherència al pòdcast

L'argument a favor de l'ús de la intel·ligència artificial en processos creatius, diu Torrijos, és "utilitzar-la com a base per anar-ho retocant i no partir de la pàgina en blanc".

Una proposta que no és nova

Malgrat que el pòdcast creat per IA és un concepte nou, la redacció de llibres amb algoritmes en té poc d'innovador. El 2016 un grup d'investigadors de l'Institut d'Enginyeria del Coneixement de la Universitat Autònoma de Madrid va presentar NeuroCervantes, un projecte entrenat amb obres de l'escriptor espanyol que era capaç d'imitar el seu estil de narració. L'equip el va batejar amb el nom com "el cervell que va estudiar El Quijote".

Altres exemples són 1 The Road, de l'artista i hacker Ross Goodwin, que va utilitzar un portàtil, un micròfon, un GPS i una càmera dins d'un cotxe per recórrer els Estats Units i emular el novel·lista nord-americà Jack Kerouac al llibre El camí. El recorregut, les imatges i els sons captats eren l'estímul que ensenyaven els algoritmes encarregats de redactar l'obra final.

I si es busca sortir de la novel·la per anar al sector dels manuals, Lithium-Ion Batteries de l'editorial Springer Nature, amb la col·laboració de la Universitat Goethe de Frankfurt, es considera el primer text tècnic redactat per una IA.