“Tothom s’hauria d’alfabetitzar en l’ús de dades”
Eli Vivas Periodista de dades i cofundadora de StoryData
Categories:
La primera agència de comunicació de dades d’Espanya va néixer fa tot just dos anys a Barcelona. El seu nom és StoryData i està liderada per cinc dones, entre les quals hi ha Eli Vivas. El seu eslògan és ‘Les dades s’obliden, les històries, no’ i amb ell fan referència a un context en què “no sabem com explicar totes les dades que tenim”. “Expliquem històries rere les dades perquè el cervell humà és incapaç de retenir tants números o paraules, cal convertir els Excels en històries amb un fil conductor”, detalla Vivas. I aquesta és part de la feina de la start-up, que té com a objectiu situar el perfil del professional de les dades com a fonamental en qualsevol entorn, i aportar informació veraç i contrastada a una societat cada cop més impactada per la desinformació.
Tenim un excés de dades?
Les dades són un concepte abstracte que podem materialitzar en files i columnes. Sovint estan emmagatzemades, i en tenim moltes, i sabem que d’aquí ha de sortir alguna cosa. Els últims anys, gràcies al big data, molta gent ha descobert que les tenia guardades sense haver-ne fet res. Ara s’està intentant abstreure uns valors per a determinades estratègies, sobretot les que afecten la presa de decisions, i s’ha vist que són molt valuoses. Però el problema es troba en com les comuniquem tant a la ciutadania com internament en les empreses. El problema no és tenir o no un excés de dades, sinó tenir les dades adequades per a l’objectiu que ens hem marcat.
No sabem com comunicar-les. Ens falta també humanitzar-les?
Durant la covid-19 es va veure molt clarament. El Departament de Salut va fer esforços per crear dashboards, però quan te’ls mires, veus que potser no cal creuar-ho tot amb tot. Podem estar parlant de la mortalitat infantil i potser no cal mostrar la dels adults. O cal mostrar que les dones no moren del mateix que els homes. Per comunicar les dades, sigui l’entorn que sigui, cal un treball previ de saber què interessa i de separar les dades. Normalment, es buiden dades sense pensar que poden haver-hi coses que no cal explicar. Els periodistes estem molt acostumats a saber l’interès general perquè fa molts anys que hi treballem, estem tot el dia mesurant què llegeix la gent i sabem quins temes interessen, per això som perfils que poden comunicar bé les dades. En les empreses, encara que no sigui tan necessari aquest relat humà, també és clau saber què vols explicar.
"La llei de transparència està lluny de ser transparent"
El ‘big data’ és un exemple més de tecnologia que arriba massa accelerada?
Rere cada disciplina, hi ha tot un món que cal aprendre abans d’utilitzar la tecnologia adequadament, i això no ho estem fent bé. Les dades i les dades obertes van prendre sobretot importància amb la Llei de Transparència, que va fer que les administracions públiques les posessin a l’abast de la gent. Això era un caramel perquè, per exemple, es pot saber a on va la contractació pública. Però tot això ha de tenir un objectiu, saber quina informació vols mostrar i visualitzar-ho.
Les dades estan a l’abast de la ciutadania, però ho sap? Sap com accedir-hi?
Em sorprèn veure que molta gent no ho sap, no som conscients que podem accedir a les dades públiques tot i que la llei es va aplicar el 2014! Fins i tot hi ha periodistes que no ho saben, i també pocs mitjans amb periodistes de dades que treballin aquesta informació. Aquest és un perfil professional nou sorgit de la tecnologia, però sovint en els equips es troben enginyers que tenen també aquest vessant més comunicatiu. La llei ha posat a disposició de la ciutadania moltes dades i no tothom sap com descarregar-se un data set o què fer amb ell. O no sap què és un arxiu .csv, o com extreure la informació; tot això és bàsic per treballar les dades. Si hi ha pocs professionals que ho sàpiguen fer, la ciutadania està encara menys preparada per fer-ho. Hi ha una bretxa tecnològica a superar. També és qüestió de fer pressió perquè s’ofereixin les dades en formats més amables perquè la gent les pugui utilitzar. I que la llei serveixi. Pots fer una petició d’informació i te la tiren enrere perquè diuen que vulnera algun element. Sovint coses que no estan ben argumentades, per això hi ha el GAIP, la comissió de Garantia del Dret d’Accés a la Informació Pública. Si l’administració no et dona les dades, pots anar a aquest comitè d’experts; i sovint els periodistes ho hem de fer. Al final, et donen la raó perquè la llei de transparència està lluny de ser transparent. La llei és una mica opaca, et va posant obstacles. Per exemple, necessites un certificat digital per accedir a la informació i no tothom en té.
“Cada municipi de Catalunya té un portal de dades obertes i la majoria estan infrautilitzats perquè ningú els alimenta”
On falla la llei?
Hi ha molts ajuntaments que creuen que la informació és d’ells i et diuen que no ho poden cedir perquè és informació confidencial, encara que sigui pública. Perquè hi hagi una bona cultura de dades dins d’una administració pública cal també que els fluxos d’informació estiguin ben connectats. Si un departament té un Excel, ha de fer que passi per un circuit centralitzat on hi hagi tota la informació. Per arribar-hi, abans cal fer molta feina des del data center perquè tots els departaments donin les seves dades. Això tan senzill, hi ha moltes administracions que no ho saben. Cada municipi de Catalunya té un portal de dades obertes i la majoria estan infrautilitzats perquè ningú els alimenta. És un greu error perquè tenir tota aquesta informació sistematitzada és una ajuda per ser més eficient a l’hora de prendre decisions.
En quina posició estem en cultura de dades respecte d’altres països?
L’altre dia parlava amb un noi francès que treballa amb dades sobre el clima. Em deia que en el seu camp, que també utilitza dades de població, a Catalunya i a Espanya és més fàcil obtenir dades que a Alemanya, on has de pagar per tenir-les. Aquí ens ho trobem amb les dades de codis postals, que les té Correus i les has de pagar si les vol. Segurament per a les empreses logístiques és útil i els va bé per treure un rendiment econòmic. Jo sempre em queixo d’aquí, però quan et compares amb Europa, no estem tan malament. En la pandèmia de la covid-19, companys meus d’altres mitjans deien que Catalunya dona moltes dades i segmentades, mentre que havies d’anar cada dia a baixar-te moltes dades del ministeri i després treballar-les. La Generalitat s’ho creu bastant i ha posat a disposició de la gent dades per fer-ne comunicació. En canvi, si ens comparem amb els Estats Units o amb el Regne Unit, és un abisme. I no només en disponibilitat de dades, sinó també d’experiència d’usuari. Ells ja tenen treballada la part de visualització amable de les dades perquè una persona que no té coneixements en dades també pugui treure conclusions.
Quines habilitats calen per treballar i entendre les dades?
A StoryData hem fet cursos per a públics diferents. Un d’ells és a Elisava sobre disseny de la informació i visualització de dades amb dissenyadors, periodistes, sociòlegs, matemàtics que volen conèixer la part humanística... l’entorn de les dades és molt transversal. Cal saber sobre estadística, números, programació o disseny. Fa poc també vam fer una formació amb iniciativa OpenData i teníem 30 dones que venien de mons diferents: advocades, arquitectes, comunicadores... Tothom s’hauria d’alfabetitzar en l’ús de dades. Cal incidir ja en l’educació perquè, si no se sap treballar amb dades, es perd un coneixement essencial i la capacitat de valorar la informació que ens arriba.
"Cal incidir ja en l’educació perquè, si no se sap treballar amb dades, es perd un coneixement essencial"
Precisament les dades permeten desmentir les ‘fake news’, però també les alimenten.
Quan es comunica una informació, s’ha de posar sempre la font. Hem de contextualitzar els gràfics i dir quan es va crear, i fer el mateix amb les imatges. Això els mitjans ho fem, però a les xarxes socials les comunicacions no segueixen aquesta pauta. No pots agafar una imatge d’una manifestació a Ucraïna i dir que és a Rússia sense donar cap més informació de context. Es fa massa sovint això de descontextualitzar, de no posar la font ni l’explicació que l’acompanya. Per això les dades poden alimentar les fake news quan no es presenten adequadament, però són també la clau per desmentir-les.
Com actuen els bots i usuaris falsos amb el creixement de l’ús de la intel·ligència artificial?
Abans era fàcil detectar els perfils falsos amb les faltes d’ortografia, però avui dia amb ChatGPT, que parla un bon català, no és tan clar. En el cas de les imatges i els vídeos, en el moment en què es poden generar des de zero, com detectes que és fals? Ja no es pot fer una cerca a la xarxa per trobar qui l’ha compartit per primera vegada per trobar la font i garantir que és veraç. Quan una imatge surt del circuit de la IA i es comparteix a WhatsApp o a les xarxes socials, ja no es pot saber la font d’origen. És molt difícil identificar les fonts dels continguts ara amb la generació de continguts amb intel·ligència artificial, cada cop la sofisticació de la mentida és més difícil de detectar. Per això hi ha un debat ètic i s’ha iniciar un procés de regulació per part de la Unió Europea. La IA està generant nova desinformació i la bola és gegantesca, però també anirem veient com entren en la roda altres tecnologies com la blockchain, que amb els seus registres podran garantir que no hi ha manipulació.