La intel·ligència artificial de DALL·E es passa al català

El desenvolupador Marc Pujol localitza l’aplicació a la nostra llengua en una versió que ja ha generat gairebé 13.000 imatges en tres dies

Redacció

DALLE.cat permet generar imatges a través de missatges de text gràcies al seu model d'intel·ligència artificial
DALLE.cat permet generar imatges a través de missatges de text gràcies al seu model d'intel·ligència artificial | MetaData

En les darreres setmanes, l’aplicació DALL·E mini, ara coneguda com a Craiyon, ha causat furor a les xarxes. Es tracta d’una reproducció gratuïta i de codi obert del model d’intel·ligència artificial (IA) d’OpenAI, Dall-E 2, que permet generar imatges a través d’ordres escrites i que els usuaris han estat testejant amb multitud d’idees, com bé recull el compte Weird Dall-E Generations. Tanmateix, un obstacle amb què compta l’eina és que està pensada per interpretar els textos només en anglès. Per tal d’oferir una solució millor localitzada, el desenvolupador solsoní Marc Pujol ha creat DALLE.cat, una versió de la IA en qüestió adaptada per comprendre les ordres en català.

Publicat el passat diumenge, DALLE.cat ja ha generat més de 12.800 imatges a través de les ordres donades pel públic. La raó d’aquesta localització en català no és altra que la de donar més opcions a la ciutadania. “M’agrada molt aquesta tecnologia i ja em vaig fixar en DALL-E quan ho va publicar OpenAI. Més endavant, navegant per Twitter vaig veure que s’estaven popularitzen les imatges autogenerades (per DALL·E mini), fins i tot en molt comptes catalans, però les frases sempre eren en anglès”, relata Pujol en una trucada telefònica.

El procés d’adaptació, segons explica el desenvolupador, ha estat “molt senzill”, ja que ha consistit a introduir un sistema que tradueix els textos de la gent del català a l’anglès abans d’introduir-lo al model d’IA. La dificultat més gran l’ha trobat en l’accés a aquesta tecnologia: “Encara que sigui open source, necessitaria un equip superpotent sempre en línia per poder processar totes les precisions”. És per aquesta raó que l’aplicació fa ús de TPU Research Cloud, una eina de Google orientada als investigadors en machine learning que els ofereix una plataforma cloud de gran capacitat per testejar les seves tecnologies a canvi que aquestes es publiquin en codi obert.

Pujol: "DALLE té una originalitat sorprenent, sembla humana fins a cert punt. No només té en compte el contingut, sinó també la forma"

A escala tècnica, Pujol considera que la fortalesa més gran del model d’intel·ligència artificial és la seva capacitat creativa: “Té una originalitat sorprenent, sembla humana fins a cert punt. Encara falta molt, però està molt avançat. Si li demanes un ruc català a la lluna, no només te’ls representa, sinó que té en compte que miri la Lluna, la perspectiva, com estan col·locades les coses... No només té en compte el contingut específic, sinó també la forma”. Per contra, les principals limitacions de l’eina es troben a l’hora de representar cares humanes específiques i textos concrets.

La popularitat de què ha gaudit DALLE.cat ha sorprès Pujol, qui va desenvolupar l’aplicació com un projecte secundari més dels que ha creat, entre els quals es troben un joc sobre endevinar capítols de la sèrie Plats Bruts o una eina per enviar roses virtuals per Sant Jordi. Davant d’aquest èxit, el desenvolupador ja ha afegit alguna millora a l’eina, com la possibilitat de veure les imatges generades pels textos d’altres usuaris. En cas de continuar creixent, Pujol es planteja incorporar noves característiques, com “un sistema de registre per desar les imatges que has generat o per comentar i donar like a les d’altres persones”, però també és conscient que un creixement desmesurat pot impactar a la seva butxaca: “Tot i que la meva despesa econòmica sigui poca, ja m’ha arribat un càrrec de 40 cèntims, i m’ha sorgit la por sobre què passarà si entren 10.000 o 100.000 persones”. En aquest sentit, el programador s’ha plantejat incorporar anuncis al portal, però les proves que ha fet no l’han convençut, així que no descarta la possibilitat de limitar el nombre de persones que poden accedir simultàniament a la gent, en cas de créixer molt més.

L’aplicació permet visualitzar les creacions d’altres usuaris mentre esperem que generi la nostra petició, que triga entre 30 segons i tres minuts