Poden les intel·ligències artificials compondre cançons per a “Eurovisió"?
AImCAT és el primer equip català en participar a l’AI Song Contest, un concurs internacional de música creada amb algoritmes
Categories:
Des dels inicis de la humanitat, la música ha estat una de les eines més útils per expressar els sentiments i les experiències personals. La disciplina s’ha anat adaptant a les innovacions tecnològiques, però sempre ha estat fermament lligada a la invenció humana. Amb tot, l’evolució desenfrenada de la intel·ligència artificial (IA) ha portat a les màquines al camp de la creació artística, donant lloc al sorgiment de l’AI Song Contest, un concurs internacional de música creada a través d’algoritmes reconegut com a “l’Eurovisió de la intel·ligència artificial”. El certamen se celebrarà el pròxim 6 de juliol i comptarà amb la presència d’un equip català, AImCAT.
“Vam decidir que la cançó havia de tenir un fil argumental basat en la relació entre les persones i les màquines”, relata el consultor en IA Jordi Planas, lletrista de la cançó. Sota el títol I Feel the Wires, l’obra és fruit d’un treball col·laboratiu d’un equip de gairebé 40 persones, que han treballat conjuntament amb les aportacions de diverses intel·ligències artificials en la composició melòdica, la lletra i fins i tot part de la interpretació.
Cocreació entre humans i màquines
Les condicions de l’AI Song Contest especificaven que la peça s’havia de crear en un període de sis setmanes a través d’un procés que inclogués la IA en alguna de les seves fases. "Des del primer moment vam veure clar que no podíem desenvolupar tecnologia pròpia i que havíem d'utilitzar tecnologia existent", explica Planas amb relació a la limitació temporal del projecte. És per això que l’equip va optar per models oberts o als quals tenien accés a través d’algun membre del grup. Pel que fa a la creació de la lletra, AImCAT va apostar per una API desenvolupada per l’organització Open AI, basada en GPT-3 i entrenada amb terabytes d‘informació. Per la seva banda, la composició musical s’ha generat gràcies al model Magenta de Google, una eina que permet "contextualitzar els elements d'una cadena d'informació, posar-los en relació entre si i treballar les ambigüitats que hi puguin haver", segons l’expert en intel·ligència artificial.
La lletra i la melodia de la cançó creada per AImCAT s'han composat a partir d'estrofes i versos generats per intel·ligències artificials a partir de creacions humanes
En ambdós processos, l’equip ha optat per un treball cocreatiu entre humans i màquines per tal de respectar el missatge de la cançó. Per la lletra, la primera fase va córrer en mans de les persones de l’equip, que van compondre un conjunt d’estrofes de quatre versos en català i en anglès. A continuació, els tècnics van introduir aquestes creacions a la intel·ligència artificial per tal que generés automàticament continuacions per a totes elles. "Vam acabar amb més d'un centenar d'estrofes creades per la màquina a través dels exemples que li havíem donat", recorda Planas. El darrer pas va ser, altre cop, humà, ja que l'equip va ser el que va decidir quines d'aquestes estrofes utilitzar i com ordenar-les per garantir la “coherència argumental" que buscaven.
Amb la sintonia es va emprar una tècnica similar. Els músics de l'equip van compondre una sèrie de fragments melòdics, que després van introduir al model Magenta perquè en generés de nous. "La gràcia és que un músic pot passar mitja hora creant un fragment, mentre que la màquina te'n dona 100 en qüestió de segons", assevera el lletrista.
En el posterior procés de selecció, el criteri va ser més experimental, respectant en diverses ocasions les solucions originals que proporcionava la màquina. Tota la introducció, per exemple, sorgeix de la intel·ligència artificial: “Creiem que dona una sensació entre misteri i angoixa, que lliga molt bé amb la idea de fer un diàleg entre màquina i humans, en què comencen amb una certa malfiança mútua", argumenta Planas. Així mateix, cap a mitja cançó es produeix un silenci més llarg del que és habitual en aquestes composicions, una idea generada per la IA que AImCAT va decidir mantenir: "Era arriscat, però ens va semblar coherent".
Planas: "Un músic pot passar mitja hora creant un fragment, mentre que la màquina te'n dona 100 en qüestió de segons"
El darrer pas de la producció musical, la interpretació, ha caigut en mans humanes. Les veus, interpretades per Berta Bähr i Laia Bosch, representen les dues parts del diàleg entre màquina i humans que vol reforçar la cançó. En aquest cas, el repte es trobava en com cantar una composició generada, parcialment, per un algoritme. "La interpretació ha estat força interactiva. Quan treballes amb intel·ligència artificial, la resposta que et torna ja marca els temps. El que hem fet ha estat intentar agafar les propostes que més s'ajustaven al que buscàvem i fer-ne adaptacions en funció del criteri artístic de les persones", comenta el lletrista. Amb tot, les màquines també tenen un paper testimonial en aquest procés, ja que al final del tema s'incorporen uns cors que estan produïts per una veu sintètica.
Un projecte sorgit d’internet
Darrere d’I Feel the Wires hi ha un grup humà de 38 persones actives d’àmbits professionals diversos i sense connexions prèvies entre ells. “L’equip es va crear d’una forma que fa 10 anys hagués estat impossible”, explica Planas. Un tuit de l’impulsor del projecte, Tomas Nihlen, va ajuntar a més de 60 persones especialitzades en intel·ligència artificial, música, comunicació i psicologia, que van organitzar-se entorn d’un canal de Slack per començar a treballar en la proposta.
Atès l’escurçat temps disponible per a produir la cançó, el volum de l’equip i la manca d’interacció prèvia entre els seus membres, calia trobar una manera de coordinar el projecte per arribar a un resultat del nivell desitjat, i aquesta tasca va recaure sobre Pere Pèries. L'escriptor i compositor, amb experiència en els camps de la narrativa, la poesia, el teatre i la música, s'ha encarregat de proposar la dramatúrgia de la cançó i de marcar els tempos de la producció de la peça. "L’expertesa d’en Pere Pèries ha estat fonamental. Ha estat una peça clau per marcar els fonaments crítics i fer avançar el grup", reconeix Planas.
La cançó ha estat creada en un període de sis setmanes per un equip de 38 persones de diversos àmbits professionals i sense interaccions prèvies entre elles
Amb tot, la coordinació del projecte i la voluntat dels seus participants no ha evitat haver d’afrontar determinats obstacles. Un d’ells ha estat la dificultat per dirigir el gran conjunt de propostes cap a una única meta: "Les idees estan molt bé, però es poden convertir en una cosa caòtica que no et porti enlloc, sobretot si les persones les defensen amb un excés de zel", opina el consultor en intel·ligència artificial. La clau, explica, ha estat que tothom acceptava que les seves idees eren una més. "El fet que la IA havia de tenir un paper important també ha modificat el procés habitual", afegeix.

La música del futur
Jordi Planas creu que no trigarem gaire temps a veure més produccions musicals generades per intel·ligències artificials. "En música, hi ha molts recursos que es fan servir per múltiples històries, des de posar sintonia a un restaurant a cançons per a anuncis televisius, que potser no necessiten un gran creador al darrere", apunta. L'expert també visualitza un futur en què la tecnologia col·labori en les creacions musicals col·lectives: "Imagina que, en dos anys, vas a un concert sabent que seràs una peça clau per la creació de la cançó. Un DJ podria utilitzar el públic perquè vagi triant les parts de la cançó generades automàticament. La intel·ligència artificial ens podrà aportar coses que fins ara no havíem pogut imaginar".
AImCAT té clar que vol participar en la pròxima edició de l'AI Song Contest, però més enllà del concurs, també té planejat constituir-se com a organització per a promocionar l'ús de la intel·ligència artificial en processos artístics. Els seus membres encara han de debatre de quina manera s'organitzaran i si s'estendran per Catalunya en petits grups o si formaran un nucli cohesionat, però de moment ja estan treballant en un vídeo per ensenyar el procés creatiu de la cançó i en un projecte per mostrar com utilitzar algoritmes genètics per a la creació artística, que es presentaran conjuntament al Sónar 2021.