La intel·ligència artificial compon la banda sonora del món digital
L’ús d’algoritmes en la creació musical i d’àudio es consolida com un suport per a la generació creativa de les persones
Categories:
La primera peça musical creada amb un ordinador data del 1956. El seu nom és Suit Illiac i és obra de Lejaren Hiller amb l’Illiac de la Universitat d’Illinois I, el primer superodinador allotjat per un centre acadèmic. La notícia es va rebre amb sorpresa, escepticisme, curiositat i, també, amb certa por. Així ho narrava una notícia del United Press, que descrivia el resultat com “una suite composta per un cervell mecànic” i que recollia l’opinió d’un oient que temia perquè la tecnologia eliminés “la necessitat de compositors humans”. Des d’aleshores, hem vist com el Japó creava la cantant virtual Hatsune Miku, grans plataformes com Spotify o Youtube introduïen algoritmes per fer recomanacions segons cerques anteriors, o com els Jocs Olímpics de Tòquio 2020 empraven la intel·ligència artificial (IA) per llançar el ritme oficial a partir de 1.000 samplers de diferents sons.
Des de la dècada dels 60 fins ara, la IA s’ha aplicat de manera transversal. “Està en molts sectors, però amb pràctiques molt limitades”, apunta l’investigador del Music Technology Group de la Universitat Pompeu Fabra Dmitry Bogdanov, “les màquines no tindran una intel·ligència pròpia, són patrons tècnics estadístics que troben fórmules a través de dades que es poden utilitzar”. I és que, insisteix, “es fa IA des de fa molts anys”, però ha estat el deep learning qui ho ha impulsat tot: “Ara tenim software, targetes gràfiques molt potents que permeten anàlisi en l’escala llarga de dades...”. L’aprenentatge profund, que té la seva base en algoritmes d’aprenentatge automàtic, té la capacitat de reconèixer la parla, imatges o fer prediccions. “Sovint s’empra en l’anàlisi de música a partir d’àudio i metadades”, apunta l’especialista, “ara ens trobem en la fase de generar col·leccions de dades i curar dades que representen diferents músiques, sons o patrons”.
Veus artificials, però reals
Tota aquesta tecnologia ja ha portat al mercat el processament de veu i música. Existeixen algoritmes programats per modificar veus gravades, crear cantants o, fins i tot, llançar discos nous d’artistes coneguts. “Podríem agafar la veu de Michael Jackson i treure un nou àlbum a través de sintetitzar cançons antigues amb noves”, proposa Bogdanov. La spin-off de la UPF Voctro Labs treballa en aquesta línia i ha llançat dos productes: Voiceful, que generar veus artificials per a videojocs, i Cantāmus, un programa per llegir partitures i generar automàticament veus de corals que faciliten els assajos dels intèrprets.
Bogdanov: “Podríem agafar la veu de Michael Jackson i treure un nou àlbum a través de sintetitzar cançons antigues amb noves”
Aquesta companyia és la creadora d’Ona, la primera cantant virtual en català que va actuar el 2013 a les festes de la Mercè de Barcelona; i d’en Bruno, la Clara i la Maika, les veus en espanyol per al software de síntesi de veu Vocaloid de Yamaha. Aquestse es diferencien de la japonesa Hatsune Miku perquè la creació d’aquestes s’ha basat en dades, mentre que l’holograma nipó es va crear, segons l’expert del MTG, en una enginyeria més bàsica.
Trobar la fórmula estrella
Altres de les pràctiques que ja inclouen la intel·ligència artificial són la separació de pistes, extracció d’instruments i ritmes, o remescla de música. “Una cosa molt comuna és simular mètodes clàssics d’estudi que eren analògics per generar nous àudios i efectes creatius entrenats amb dades; o reducció del so ambient en trucades com les de Zoom, que ja es fa automàticament”, apunta l’investigador.
I és que tant artistes com discogràfiques tenen en la tecnologia un aliat. Quan un compositor o es queda encallat, amb una melodia a mitges, la IA pot ser aquesta segona “mirada” que escolti la melodia, l’analitzi i proposi complements que ajudin a avançar o enriquir la feina ja elaborada. “A través de l’anàlisi de les notes o els instruments usats, el sistema fa propostes”, comenta Bogdanov, “però hem de tenir clar que els algoritmes potser s’han entrenat amb uns ritmes i gèneres determinats, per això els resultats seguiran aquests estils”. Si les dades introduïdes a les bases de dades per alimentar la IA surten de títols d’èxit, les discogràfiques poden tenir la garantia que les noves propostes tindran una rebuda similar sempre que no canviïn les tendències.
Qui té com a client la indústria musical és la start-up catalana BMAT, amb un programari que utilitzen prop de 5.000 clients d’arreu del món per controlar reproduccions de peces musicals a la ràdio, la televisió, sales de festa i plataformes digitals. A partir del rastreig amb algoritmes entrenats, abonen l’import pertinent en concepte de drets d’autor, donant un cop de mà a entitats com l’SGAE. Així és com es diferencia de Shazam, que no té la capacitat d’identificar remix o versions perquè no treballa amb cap sistema de machine learning.
L’espectre mediàtic de la IA més musical
S’han fet anuncis i concerts amb veus i melodies artificials, però també concursos musicals i festivals. L’AI Song Contest, una competició de cançons generades amb intel·ligència artificial, n’és un bon exemple. Va ser creada el 2020 per l’organització pública neerlandesa de ràdio i televisió VPRO, amb la supervisió de la Unió Europea de Radiodifusió, l’organisme encarregat d’Eurovisió, i va donar la victòria als australians Uncanny Valley amb Beautiful The World. En una segona edició, Catalunya va tenir-hi presència per primera vegada amb la participació del grup AImCAT.
Sota el títol de I Feel the Wires, 40 persones van col·laborar amb l’aportació de diverses intel·ligències artificials de codi obert en la composició melòdica, la lletra i la interpretació. La col·laboració, relata en un reportatge a MetaData el consultor en IA i lletrista de la cançó, Jordi Plana, va consistir en la creació “d'un centenar d'estrofes creades per la màquina a través dels exemples donats” i una selecció humana posterior per garantir la “coherència argumental”. Una de les eines triades per a la creació va ser Magenta, de Google, disponible per a un públic massiu que vulgui endinsar-se en aquest món.
El Sónar+D també ha posat a prova la tecnologia davant d’artistes consagrats. En la passada edició Marco Mezquida va compartir escenari amb un ordinador entrenat per reconèixer i comprendre la música del pianista, i oferir una segona melodia d’acompanyament. La intel·ligència artificial llegia en temps real les dades per fer una aportació que mantingués el ritme i la sintonia de l’artista real. Una màquina capaç, fins i tot, de respondre a les improvisacions del menorquí.
Cal posar límits als algoritmes?
Davant aquest panorama, sorgeix un dubte moral: fins on arriba l’aportació creativa humana amb la introducció de l’automatisme tecnològic? “Els artistes poden ser curadors d’algoritmes i controlar-os segons el seu criteri estètic”, respon l’especialista, “anirem cap a una dinàmica de treball on hi haurà qui prefereixi les dinàmiques clàssiques i manuals, i qui opti per introduir solucions tecnològiques en una part o en tot el procés”.
Però cal tenir en compte els biaixos que pot generar la tecnologia. Fins ara s’ha parlat de discriminació de gènere, raça o religió, entre altres, però en l’entorn musical cal parlar d’estils i de drets d’autor. Tal com assenyala Bogdanov, entrenar un sistema amb cançons del moment suposarà treballar amb bases de dades d’uns ritmes determinats: “Els resultats obviaran altres estils que, potser, en aquell moment no tenen tants adeptes, i pot provocar que la música poc representada estigui encara menys representada”.
Bogdanov: “Els biaixos de la IA poden provocar que la música poc representada estigui encara menys representada”
En termes de drets d’autor, reclama parar atenció als bruits legals, ja que les noves cançons sorgides d’aquesta IA esbiaixada podrien ser considerades còpies. “No queda clar si ho són o no, ja que seran creacions semblants a les d’un artista conegut, però sense que suposi una còpia íntegra”, assenyala. Per això proposa fer més transparents els algoritmes i les dades, una reivindicació transversal per a qualsevol aplicació que tendeixi cap a la intel·ligència artificial.