Google presenta Gemma, la variant ‘oberta’ i lleugera de Gemini per a desenvolupadors

El nou model d’intel·ligència artificial s’ha dissenyat perquè pugui adaptar-se a més dispositius i ofereix millors resultats en els tests que el Llama-2 de Meta

Categories:

Redacció

Gemma s'ha desenvolupat amb la mateixa tecnologia que Gemini, però és més lleuger i està orientat a desenvolupadors
Gemma s'ha desenvolupat amb la mateixa tecnologia que Gemini, però és més lleuger i està orientat a desenvolupadors | MetaData

Google ha arrancat el 2024 amb la mirada centrada clarament en la intel·ligència artificial. El model Gemini és la gran aposta de la multinacional per aquesta tecnologia, fins al punt d’imposar-se a Bard com a principal terminologia dins de l’empresa, però ara la companyia ha presentat el que es podria considerar la cosina petita d’aquest model: Gemma. Denominada així pel significat de ‘pedra preciosa’, Gemma és un model d’intel·ligència artificial que fa servir la mateixa recerca i tecnologia que Google DeepMind ha aplicat a Gemini, però a una escala més petita i amb dues diferències fonamentals: està orientat a desenvolupadors i compta amb una llicència comercial més oberta que altres alternatives.

La família de models Gemma es troba ja disponible en dos models de diferents mides, Gemma 2B i Gemma 7B —la B indica els bilions de paràmetres que inclou—. Tots dos models es troben en les puntuacions més altes dels testos per avaluar aquesta classe de tecnologies en el rang equivalent a la seva mida, amb notes força més elevades que les variants del Llama-2 de Meta. Gemma ofereix resultats especialment bons en les proves que impliquen fer servir raonaments de sentit comú per a tasques diàries, i també es defensa bé en el test més general. En canvi, té més mancances en operacions matemàtiques complexes i a l’hora d’escriure codi informàtic.

Gemma s’ha desenvolupat perquè sigui especialment lleuger i es pugui fer servir en tota mena de dispositius, com ara ordinadors portàtils o des del mateix Google Cloud, sense exigir-los grans capacitats. Tot i que per definició no es pot considerar un programari de codi obert, sí que és cert que la seva llicència permet ser utilitzat i modificat per entitats amb lucre o sense, sigui quina sigui la mida de l’empresa. Amb la intenció que els desenvolupadors puguin fer servir el model sense problemes, Google ha integrat Gemma en les principals eines de treball, com ara HuggingFace, MaxText, NVIDIA NeMo o TensorRT-LLM. També ha habilitat suport per als principals frameworks (JAX, PyTorch i TensorFlow) i ha publicat una guia amb recursos orientada a professionals.