"L'aprenentatge del reforç està rere molts dels avenços de la intel·ligència artificial" - Diari de Barcelona
Gergely Neu
membre del grup de recerca en Intel·ligència Artificial i Aprenentatge de Màquina de la UPF
"L'aprenentatge del reforç està rere molts dels avenços de la intel·ligència artificial"
No cada dia es rep una beca d'1,5 milions d'euros per investigar sobre la teva passió. Però Gergely Neu (36 anys, Hungria), gràcies al seu esforç i treball ha obtingut un ajut ERC Starting Grant per dur a terme el seu projecte: Provably Efficient Algorithms for Large-Scale Reinforcement Learning (ScaleR) en els pròxims cinc anys.
Neu va finalitzar el seu PhD (Doctorat en Filosofia) a la Budapest University of Technology and Economics l'any 2013, durant els seus estudis va tenir l'oportunitat d'anar la Universitat d'Alberta al Canadà. Posteriorment, va fer un postdoctorat durant dos anys a França al grup de recerca Inra. Fins que va aterrar a Barcelona l'any 2015 per unir-se al grup de recerca en Intel·ligència Artificial i Aprenentatge de Màquina de la Universitat Pompeu Fabra.
T'esperaves rebre la beca ERC Starting Grant?
Oh no! Mai ho hauria pensat, potser només en els meus somnis. L'ERC Starting Grant és extremadament competitiva. Això realment m'obre enormes possibilitats per al futur que em permetran estendre els meus horitzons en la recerca, el meu nombre col·laboradors dins del laboratori i incrementar la meva productivitat. Mai havia pensat que seria capaç de fer això. Ha estat una sorpresa per a mi i suposo que un enorme honor i prestigi.
En què se centra la teva feina?
La meva feina sempre s'ha centrat en els aspectes teòrics de l'aprenentatge automàtic. Intento entendre les limitacions teorètiques utilitzant algoritmes.
"M'obre enormes possibilitats per al futur que em permetran estendre els meus horitzons en la recerca, el meu nombre col·laboradors dins del laboratori i incrementar la meva productivitat"
Què és l'aprenentatge automàtic?
Avui en dia l'aprenentatge automàtic està considerat com a una matèria més àmplia, que no és només part de la intel·ligència artificial. L'aprenentatge automàtic aplica matemàtiques i enfocaments estadístics a la intel·ligència artificial. Tot plegat, realment és la ciència de l'aprenentatge de dades: veure dades fiables i treure conclusions d'aquestes dades d'una manera automàtica i intentar generalitzar aquestes dades que el sistema d'aprenentatge no veia abans.
Com sorgeix el teu interès en aquest tema?
Originalment cursava la carrera d'Enginyer Elèctric, però sempre m'interessaven més els aspectes matemàtics o formals de l'enginyeria. Durant la universitat estava segur que volia aprofundir en una recerca que fos més semblant a la matemàtica i la formal. Llavors em vaig creuar amb el meu supervisor de doctorat, Csaba Szepesvári. Ell estava fent una feina meravellosa i molt influent en l'aprenentatge automàtic teòric i vaig sentir que allò s'adeia molt als meus interessos, era molt matemàtic i molt desafiant des d'una perspectiva formal, però també tenia implicacions molt significatives en el futur de la tecnologia.
Quina rutina segueixes en la teva recerca?
La meva investigació és bastant especial, ja que és més aviat teòrica, el que significa que és molt matemàtica, a diferència de la majoria de persones centrades en l'aprenentatge automàtic i les àrees relacionades que tenen una feina més empírica i més experimental. El meu treball es basa a intentar demostrar teoremes matemàtics sobre algoritmes, garanties formals de rendiment, per tant, faig molta feina amb els meus estudiants de doctorat i els meus col·laboradors. Utilitzem una pissarra, ens reunim i fem tots pluja d'idees. Intentem treballar amb les nocions matemàtiques, i donar la volta a expressions matemàtiques i convertir-les en les formes que permeten concloure algunes garanties de rendiment útils sobre algoritmes.
I quin és l'objectiu del projecte?
L'objectiu de tota aquesta teoria és entendre les limitacions dels sistemes d'aprenentatge automàtic
Com pot incidir aquest projecte en les nostres vides?
La meva recerca se centra específicament en una àrea d'aprenentatge automàtic anomenada "Aprenentatge de reforç". L'aprenentatge del reforç està darrere de molts dels avenços de la intel·ligència artificial que han aparegut als mitjans de comunicació, com ara avenços en termes de joc automàtic de videojocs o d'altres jocs, tot això són avenços relacionats amb l'aprenentatge de reforç.
Aquest aprenentatge té molt d'èxit i és un marc molt útil per desenvolupar altres xarxes d'aprenentatge, però un desavantatge és que és majoritàriament empíric i no inclou garanties, no inclou rendiment, de manera que la meva investigació se centra realment a intentar entendre aquestes garanties, fent que aquest algoritme sigui més predictible i més fiable. Volem entendre què podem esperar de les tècniques existents, on fallen aquestes i com podem solucionar els nostres problemes actuals dins d'un marc matemàtic formal.
Com has dit, amb l'obtenció de la ERC Starting Grant t'oferirà molta estabilitat i productivitat en la teva recerca. Però, com et finançaves abans?
Abans rebia finançament de la Fundació La Caixa a través d'un projecte de recerca anomenat 'Junior Leader fellowship'. Aquesta també ha estat una oportunitat meravellosa perquè m'ha permès augmentar la meva recerca sense restriccions significatives i ha estat més que suficient per cobrir els costos de la investigació fins al moment. Abans de venir a Barcelona tenia el finançament d'un projecte europeu anomenat 'Marie Sklodowska-Curie action' que és un altre programa de recerca de prestigi a Europa. Estic molt agraït a totes aquestes agències de finançament, per confiar en mi i fer possible que vingués a Barcelona a realitzar la meva recerca.
"Només necessito un paper i un llapis per pensar sobre la meva teoria"
Hi ha més universitats o grups de recerca centrats en aquest estudi?
Et refereixes aquí?
Sí.
Aquí a la UPF no sóc l'únic que treballa en aquesta matèria, estic envoltat d'un grup d'investigadors anomenats AI&ML dirigit per Hector Geffner, que recentment també ha rebut una ERC Starting Grant. Ell ha fet un treball molt influent en intel·ligència artificial i estic molt content de poder interactuar amb ell i de compartir grup de recerca. Hi ha més col·laboradors al grup que també són fantàstics. També hi ha altres laboratoris a Barcelona com el de la Universitat Politècnica de Catalunya.
I a Europa?
D'Europa m'agradaria destacar França, on hi ha alguns laboratoris com el grup de recerca Inria. França és una superpotència quan es tracta aquest tipus de recerca. També hi ha laboratoris exitosos a Itàlia a la Universitat de Gènova o de Milà i a Alemanya també hi ha laboratoris de recerca. M'agradaria esmentar que a Europa cada vegada hi ha més interessats en investigacions d'alta qualitat en aprenentatge automàtic i intel·ligència artificial. En els darrers anys s'han formant diverses aliances d'universitats i diferents programes com ELLIS (European laboratory for learning and intelligence systems).
Estan treballant junts per establir una col·laboració internacional entre universitats que permeti unir-se a programes de doctorat entre universitats o unir-se a programes de beques o investigadors postdoctorals. Això serveix com a iniciativa per intentar evitar que investigadors exitosos i amb talent puguin marxar de les acadèmies i anar a la indústria. I això és fantàstic.
"El meu treball es basa a intentar demostrar teoremes matemàtics sobre algoritmes, garanties formals de rendiment"
Qui forma part del teu equip?
Treballo amb diverses persones. Tinc col·laboradors internacionals a Europa, als Estats Units i al Canadà. Amb ells, per descomptat, ara estic en contacte per videoconferència, ja que no puc viatjar tant com abans. Però també compto amb el suport del meu propi equip, que ara creixerà gràcies a la beca. D'aquesta manera ara tinc tres estudiants de doctorat que estan fent tots una feina increïble, i també, investigadors de postdoctorat. Però aquest número augmentarà. Aquesta beca dura cinc anys i ens permetrà contractar més persones. És a dir, l'equip creixerà molt i he de preparar-me per gestionar el grup.
Acabo amb una de les preguntes més recurrents d'aquest any, però que no podia faltar. Com ha afectat la quarantena al vostre estudi?
En certa manera vaig tenir sort. La meva investigació no necessita gaire infraestructura, realment només necessito un paper i un llapis per pensar sobre la meva teoria. És clar que fer aquesta mena d'investigacions és molt més eficaç si estem tots a la mateixa sala col·laborant i davant de la pissarra. Em faltava aquest aspecte. Però com he dit la meva feina no requereix equipament ni presència física al laboratori, així que crec que vaig ser relativament productiu, malgrat les dificultats.