Directiva, experta en transformació digital i col·laboradora de SomDONES

Les dades presenten biaixos de gènere

"Les dades ja presenten prejudicis, distorsions i manca de representativitat que donen lloc a resultats erronis"

Saps quina és la matèria primera de la transformació digital? Les dades són un element clau per al desenvolupament i entrenament dels algorismes utilitzats en intel·ligència artificial, i, per tant, per a la revolució digital que estem vivint. Encara que sembli senzill, les dades són essencials per aconseguir un avenç significatiu.

Però què són les dades? Les dades són unitats d'informació que s'obtenen de diferents fonts. Per exemple, el nombre de dones en llocs de direcció a empreses de més de mil empleats que s'obté de la informació de la vida laboral o del nombre de cotxes vermells venuts que es recopilen de les vendes de les diferents empreses automobilístiques en un any. Aquesta quantitat de dades generades cada dia és aclaparadora. De fet, s'estima que es generen al voltant de 2,5 trilions de bytes de dades diaris, cosa que equival a uns 29,17 gigabytes per segon o aproximadament 1,75 terabytes per minut.

Un byte es compon de 8 bits, i cada bit pot tenir un valor de 0 o 1. Exemples que poden ajudar a entendre en termes pràctics:

  • Un sol caràcter (lletra, número o signe de puntuació) ocupa un byte d'espai.
  • Una cançó de MP3 de quatre minuts de durada ocupa aproximadament 4 megabytes (MB) d'espai.

Totes aquestes dades es guarden en base de dades que serveixen per emmagatzemar i organitzar grans quantitats d'informació de manera estructurada perquè puguin ser fàcilment recuperades, actualitzades i gestionades. És difícil imaginar la quantitat i el valor de les dades, però també és important tenir en compte que les dades ja presenten prejudicis, distorsions i manca de representativitat que donen lloc a resultats erronis, conclusions incorrectes, decisions injustes i discriminatòries. Hi ha diferents tipus de biaixos en les dades, com els biaixos de representació, història, qualitat, raça, religió, gènere, entre molts altres.

"Les dades ja presenten prejudicis, distorsions i manca de representativitat que donen lloc a resultats erronis"

Els biaixos de gènere poden manifestar-se de diverses maneres en les dades, per exemple, en la selecció de les mostres, la recopilació de dades i la interpretació dels resultats. Aquests biaixos poden ser intencionals o no intencionals, i sovint es deuen a la manca de diversitat en la presa de decisions o en la composició dels equips que treballen amb les dades. Les conseqüències d'aquest tipus de biaix és un impacte negatiu en la vida principalment de les dones en àmbits com el laboral, social i econòmic, i és per això que és particularment preocupant.

Una de les àrees on més es poden veure els biaixos de gènere en les dades és al món empresarial. Moltes empreses utilitzen algoritmes i sistemes d'intel·ligència artificial per prendre decisions importants, com ara contractacions, promocions i salaris. Un dels casos més coneguts de biaix de gènere en les dades és en els algorismes de contractació. Algunes empreses han utilitzat algoritmes que es basen en les dades per seleccionar els nous candidats, però aquestes dades i també els algorismes poden estar esbiaixats en contra de les dones i altres minories.

Un clar exemple del biaix de gènere en les dades va passar a Amazon. El 2018, es va descobrir que el seu sistema d'intel·ligència artificial per a contractacions havia estat discriminant les dones perquè les dades tenien biaixos. El sistema havia estat entrenat amb dades històriques de contractacions de l'empresa, que reflecteixen una tendència cap a la contractació de més homes que no pas dones. Com a resultat, el sistema va aprendre a preferir els candidats masculins ia penalitzar les dones, fins i tot si tenien les mateixes qualificacions.

"Les conseqüències del biaix de gènere en les dades és un impacte negatiu en la vidade les dones en àmbits com el laboral, social i econòmic"

Un altre exemple de biaix de gènere en les dades és el dels sistemes de crèdit. Alguns utilitzen variables com el gènere i l'estat civil per avaluar el risc creditici dels sol·licitants. Això pot conduir a una discriminació injusta contra les dones i altres minories en concedir crèdits segons els resultats de l'algorisme d'acord amb dades esbiaixades. L'algorisme continuarà reproduint aquest biaix en la presa de decisions en lloc de corregir-ho.

És important reconèixer i abordar els biaixos de gènere a les dades per garantir que les decisions es prenguin de manera justa i imparcial amb igualtat d'oportunitats i equitat. Això implica la recopilació i l'anàlisi de dades més rigoroses, la inclusió de la diversitat en la presa de decisions i l'eliminació de variables no rellevants en els algorismes i sistemes d'avaluació. A més, cal fomentar una major consciència i educació sobre els biaixos de gènere en les dades i els seus efectes negatius.

"És important reconèixer i abordar els biaixos de gènere a les dades per garantir que les decisions es prenguin de manera justa i imparcial"

Totes i tots podem ser part de com solucionar i prevenir aquests biaixos de gènere. Algunes de les accions que podem fer és aconseguir una major diversificació de les mostres de dades assegurant que incloguin tant homes com dones, així com diferents orígens ètnics i culturals. També implementar sistemes d'auditoria a les bases de dades i als sistemes d'intel·ligència artificial per detectar els biaixos i corregir-los.

En definitiva, l'objectiu és obtenir resultats més justos i equitatius en delegar la presa de decisions als algoritmes i, per tant, a la intel·ligència artificial.

Etiquetes