“Encara som lluny del moment en què les màquines igualin la capacitat humana”

Juan José Garau Luís Enginyer Industrial i de Telecomunicacions

Categories:

AMIC

Juan José Garau Luís estudia el 'reinforcement learning'
Juan José Garau Luís estudia el 'reinforcement learning' | Pol Audivert / AMIC

Juan José Garau Luís (1994) és doble graduat en Enginyeria Industrial i de Telecomunicacions per la Universitat Politècnica de Catalunya (UPC), becari de la Fundació “la Caixa” i ha format part d’equips com el Barcelona Supercomputing Center, la consultora Arcvi, Novartis i el Massachusetts Institute of Technology, on inici la seva carrera professional la indústria de l’espai amb un doctorat després de cursar un màster en Enginyeria Aeroespacial. La seva investigació se centra en la millora de l’aplicabilitat de reinforcement learning en el món real, utilitzant problemes de comunicacions satèl·lits i l’optimització molecular com a foc d’origen.

Quines diferències educatives i tecnològiques ha notat entre l’estada al MIT i la UPC?

Tot i que el grau d’exigència és similar, el pla educatiu és completament diferent. Els estudiants matriculats a MIT no accedeixen de forma directa a fer un grau en concret. Durant el primer curs el pla docent és el mateix per a tothom. Any rere any, els alumnes es van especialitzant, i poden optar a un programa compost per assignatures optatives. A la UPC ens trobem amb un pla docent molt encaminat des del primer curs. Fins a tercer i quart no disposes de l’opció optativa. A més, aquestes assignatures de caràcter opcional, representen un percentatge baix respecte el total del bloc obligatori. El contingut d’estudi a MIT és més transversal, engloba diversos camps humanistes (política, sociologia...) poc corrents en una carrera d’enginyeria a Catalunya. A nivell tecnològic, MIT és una universitat privada i per tant gaudeix d'una situació econòmica favorable. Ara bé, la matrícula d’accés és bastant més costosa. Per últim, m’agradaria destacar un aspecte negatiu de MIT. La cultura universitària és molt absorbent, finalitzes la setmana i te n’adones que el temps de lleure ha sigut efímer. Aquesta situació provoca una falta de desconnexió necessària.

Ha estudiat com portar a terme un control generalitzat del moviment de la població en les grans infraestructures. Com es garantirà la privacitat de les persones davant l’augment de les tecnologies de la informació per part de les autoritats? Quins problemes ètics genera?

Cada vegada existeixen més notícies que relacionen la tecnologia amb la denúncia per la falta de privacitat i ètica als controls de seguretat. Les aplicacions intel·ligents funcionen de diverses formes i la seva principal funció és encarregar-se d’identificar persones. A més, aquestes màquines disposen d’accés a dades personals. Aquesta ocurrència pot comportar una doble conjectura en termes de seguretat. Per un costat, una major seguretat;imaginem que la persona identificada ha tingut problemes legals o antecedents, permet la ràpida detecció. D’altra banda, problemes de privacitat. Aquests sorgeixen quan la persona que controla la màquina vol usar aquestes dades amb finalitats poc ètiques. L’ètica disposa de molts dominis d’estudi per analitzar aquest fenomen. Considero la no generalització de situacions un primer pas. En segon lloc, aposto per l’avaluació cas per cas i darrerament l’aplicació de transparència al procés de funcionament de la maquinària. Com a ciutadà tens el dret de conèixer la informació personal compartida i especialment qui hi té accés.

“Com a ciutadà tens el dret de conèixer la informació personal compartida i especialment qui hi té accés”

Quina tecnologia veurem en els pròxims anys que farà evolucionar la mobilitat en les grans infraestructures?

La internet of things jugarà un paper molt important en un futur pròxim. És una tecnologia que ajuda a crear un clon virtual d'un espai, aquest podria ser un aeroport o un magatzem. Aquest clon et permet conèixer en temps real l’estat d’allò que estàs monitoritzant. Posem un exemple, en un aeroport gràcies a un clon podem saber en temps real quina densitat de persones per metre quadrat trobem en diferents espais i de forma simultània. Gràcies a la monitorització podràs saber on has de col·locar més personal, predir si en deu minuts hi haurà un problema de seguretat, obrir dues línies de seguretat per poder agilitzar el pas dels viatgers, etc. Els magatzems són espais on cada vegada estan més incorporant aquest tipus de tecnologia, on es disposa d’un control en tot moment de l’estoc, s’automatitza el procés de compra d’articles a una zona i s’envia un agent a recollir-ho. Tot està coordinat i automatitzat, la internet of things facilita aquests moviments.

Un algoritme pot guanyar al millor jugador d’escacs del món. Quina és la diferència entre l’aprenentatge humà i el reinforcement learning? Podria arribar a igualar la capacitat humana?

Reinformance learning, o aprenentatge per reforç en català, pretén imitar la forma que tenen els humans i els animals d’aprendre. Com a éssers intel·ligents aprenem mitjançant reforços positius o negatius. Aquests indiquen si quelcom que hem realitzat ha estat correcte. Si és així, rebem un reforç positiu, si pel contrari ha estat una decisió negativa, rebem un càstig. El reinformance learning és un procés semblant. Trobem unes persones que avaluen i escullen el que és correcte i el que està mal fet. Imaginem un robot que té la missió de recollir un got que ha caigut i s'ha trencat. Aquesta capacitat d'observar el que envolta i de dur a terme certes accions que portin a modificar aquest context de tal manera que s'arribi a una solució del problema, s’anomena reinformance learning. El robot rebrà senyals positives, negatives o neutres. Al final del procés, si aconsegueix complir l'objectiu, significa que les decisions han estat positives i per tant han derivat a la solució de la problemàtica. En aquest cas: got recollit. Encara som lluny del moment en què les màquines igualin la capacitat humana. Actualment nosaltres anem molt més enllà que els límits establerts en aquestes. Els humans som molt bons aprenent coneixements nous, diversos i provinents de camps diferents de forma ràpida, associem amb molta facilitat. Actualment un robot que pugui adquirir tots aquests camps resulta complicat. Les línies d'investigació van cap aquesta direcció, però encara queden anys.

Quins són els seus objectius de recerca a curt termini? Quins mitjans necessitaria per desenvolupar amb plenitud les seves línies d’investigació?

Durant el màster a MIT, he aprofundit en l’estudi del reinformance learning i com ajuda a resoldre diversos obstacles en el món de les comunicacions per satèl·lit. M’he adonat que existeixen obstacles que dificulten l’adopció de forma fiable d’aquests tipus de tecnologia en les ciències matemàtiques i físiques. Com a repte personal, em proposo entendre millor de quina forma podem millorar aquests models actuals perquè puguin incorporar-se en el món real més fàcilment. A curt termini, m'agradaria identificar un subtema el qual pogués aprofundir-hi i sobretot dedicar-hi part del meu doctorat. Considero necessari tenir contacte amb empreses que puguin proporcionar casos d’ús amb dades reals, d’aquesta manera, em relaciono amb el món autèntic i puc entregar els models de forma més robusta.

“Tenim una educació que no facilita l'aprenentatge en competències digitals i, per tant, la connexió a la realitat laboral és minsa”

Quin és el dilema entre exploració i explotació en el món del reinformance learning?

Les persones que es troben dins un context realitzen accions. El dilema d’explotació consisteix en el coneixement que certes accions deriven a una determinada recompensa, i la decisió de seguir portant a terme aquestes fases. D’altra banda, podem explorar camins alternatius i provar la sort a partir d’un altre procés. Aquest cas és exploració.
El dilema és present en situacions socials que involucren éssers humans. En un restaurant podem demanar el que demanem sempre, aquesta seria una acció d’explotació, mentre que decantar-nos per l’opció de demanar plats alternatius, que ens poden agradar encara més s’emmarca dins el que coneixem com exploració.

L'Enginyeria Aeroespacial de la mà d'emprenedors com Elon Musk està experimentant un creixement econòmic exponencial. Quins són els principals reptes a curt termini que planteja la indústria aeroespacial i com el reinformance learning pot ajudar a solucionar-los?

A llarg termini, per exemple, tenim les fites per arribar al planeta Mart. A curt termini, observem projectes per millorar la connectivitat global mitjançant comunicacions satèl·lit. Gràcies a un seguit de fotografies satel·litzades podrem combatre millor i amb major efectivitat el canvi climàtic. Tant la tecnologia aeroespacial com la majoria de sistemes satèl·lits o naus espacials es troben fora del control humà en temps real. És a dir, nosaltres som a la Terra i els satèl·lits a l'espai, controlar les diferències temporals en temps real és molt complicat, una possible solució seria dotar de funcionament autònom aquests sistemes i que tinguessin la capacitat de saber com s'han d’autocontrolar en cada moment. Reinformence learning és una manera de poder dotar aquestes capacitats. Tot i ser una línia d'investigació bastant nova de moment està donant resultats força prometedors.

“Cada vegada més podem ajudar-nos de models d'intel·ligència artificial per facilitar la detecció de diagnòstics i portar a terme selecció de teràpies amb precisió”

Quines polítiques hauria de portar a terme un Estat com Espanya per posar-se al nivell de països amb un índex de desenvolupament tecnològic molt avançat?

Espanya no pot competir en economia digital del segle XXI contra països com els EUA, Rússia o la Xina. La indústria digital Espanyola és reduïda, cal una clara incentivació en aquest aspecte. El Taló d’Aquil·les de tot aquest biaix és el sistema educatiu i representa la primera passa a solucionar. Ara mateix tenim una educació que no facilita l'aprenentatge en competències digitals i, per tant, la connexió a la realitat laboral és minsa, provocant una falta de preparació per les feines immediates i greus problemes estructurals. És indispensable la creació de mòduls de formació professional orientats a cobrir les necessitats dels futurs sectors productius.

Com pot ajudar-nos de la intel·ligència artificial (IA) en la lluita contra futures pandèmies?

Pot ser de gran utilitat per ajudar-nos a predir l'evolució i la capacitat de transmissió dels virus. Observant dades de la pandèmia de la covid-19, s'han fet estudis de xarxes neuronals basats en grafts. La indagació està mostrant bons resultats i preveu l’evolució dels virus a diferents llocs del món. També existeix tot una línia de recerca que gira al voltant de la forma en què IA pot accelerar els dissenys de nous fàrmacs necessaris als hospitals. En plena pandèmia, cada vegada més podem ajudar-nos de models d'intel·ligència artificial per facilitar la detecció de diagnòstics i portar a terme selecció de teràpies amb precisió. Evitar l’augment de contagis és una prioritat. La IA aplicada en el món de la salut és un camp força consolidat i amb un potencial que hem de considerar.