Elon Musk presenta Grok 3, l’aposta de X per ocupar el lideratge en intel·ligència artificial

El nou model generatiu supera Gemini-2 Pro, DeepSeek-V3 i GPT-4o en les principals proves de matemàtiques, ciència i programació

Redacció

Grok 3 es troba ja disponible de manera limitada per als subscriptors de X Premium+, però encara no a la Unió Europa ni al Regne Unit
Grok 3 es troba ja disponible de manera limitada per als subscriptors de X Premium+, però encara no a la Unió Europa ni al Regne Unit | @xai (X)

Després de setmanes generant expectatives, l’equip de X AI, amb Elon Musk al capdavant, ha presentat aquesta matinada Grok 3, la nova versió del model d’intel·ligència artificial generativa de la companyia. La nova solució ha estat entrenada durant més de 200 dies amb 200.000 unitats de processadors gràfics, un volum més de 10 vegades superior a l’entrenament de Grok 2, i les primeres proves de rendiment (benchmark) efectuades mostren resultats superiors a la majoria dels principals competidors en àmbits com les matemàtiques, la ciència i la programació. Grok 3 ja es troba disponible a diversos països del món, però encara no als països de la Unió Europea o el Regne Unit, atès que s’està treballant en “complir les lleis locals de privacitat i protecció de dades”.

Grok 3 s’ha publicat en dos models diferents, Grok-3 i Grok-3 mini, el qual està preparat per tasques més senzilles i per donar respostes més ràpides. Ambdós models superen Gemini-2 Pro, DeepSeek-V3 i GPT-4o en les proves de rendiment AIME’24 de matemàtiques, GPQA de ciència i LCB Oct-Feb de programació. Tanmateix, no es mostra la comparativa amb els models més recents d’OpenAI, o3-mini i o1. Els enginyers també han mostrat com s’ha testat una versió primerenca de Grok 3 a la plataforma de benchmarking Chatbot Arena, en la qual ha assolit una puntuació de 1.400 punts, per sobre de tota la resta de competidors.

En la línia dels darrers models del mercat, Grok 3 també disposa d’eines de raonament profund i de cerca a la web. En el primer àmbit, el xatbot incorpora dues opcions, Think i Big Brain, amb les quals se’ls pot demanar problemes complexos i el model iniciarà un procés de pensament lògic per donar una resposta. Aquest procés s’anirà plasmant en pantalla amb un llistat de tots els passos que segueix, tot i que el mateix Musk ha admès que la funció està parcialment ocultada per evitar que altres models plagiïn Grok. Big Brain és la versió potenciada de Think, la qual fa servir molta més capcacitat de computació, i s’ha demostrat amb la creació del codi d’un videojoc que combina les mecàniques de Tetris i Jewel Quest, creat en uns pocs minuts i executat en directe. Per la seva banda, les funcions de cerca es podran activar a través de DeepSearch, que de manera similar a Think i Big Brain, mostra el procés de cerca i raonament en directe, incorporant totes les fonts consultades a la web.

El xatbot es troba ja disponible en una versió limitada per als subscriptors de X Premium+ en els països en què ja s’ha desplegat la plataforma. Paral·lelament, X AI ha anunciat que llançarà una nova subscripció, anomenada SuperGrok, que permetrà accedir a les capacitats més avançades de Grok.