Ja és aquí GPT-4.5, el nou model de propòsit general d’OpenAI

La nova aposta dels creadors de ChatGPT millora la precisió de les respostes i redueix les al·lucinacions mentre marca distància amb els models de raonament profund, com o1 i o3-mini

Redacció

GPT-4.5 es troba disponible en versió anticipada per als subscriptors de ChatGPT Pro
GPT-4.5 es troba disponible en versió anticipada per als subscriptors de ChatGPT Pro | OpenAI

Després de setmanes d’expectativa, OpenAI ha presentat aquest dijous al vespre GPT-4.5, el nou gran model de llenguatge generalista d’intel·ligència artificial que vol suposar una passa endavant en les capacitats actuals del mercat. El nou model s’ha llançat en versió anticipada per als usuaris de la subscripció de ChatGPT Pro, la subscripció més cara de la companyia, i s’hi donarà accés als usuaris de Plus i Teams la setmana vinent i als subscriptors Enterprise i Edu a la setmana següent.

OpenAI defineix GPT-4.5 com un model de propòsit general, més intel·ligent que OpenAI o1 i OpenAI o3-mini, tot i que a diferència d’aquests dos, no es tracta d’un model de raonament, és a dir, no “pensa” les respostes durant un temps abans de donar-les, sinó que respon immediatament. Això s’aconsegueix centrant-se a escalar l’aprenentatge no supervisat, el qual millora la intuïció i la precisió del model. En aquest sentit, els testos fets amb a través del test SimpleQA donen una taxa de precisió en les respostes de GPT-4.5 del 62,5%, xifra que supera els models anteriors GPT-4o (38,2%), OpenAI o1 (47%) i OpenAI o3-mini (15%). La mateixa prova també avalua la taxa d’al·lucinacions del model (respostes donades amb convenciment que són inventades), i aquí GPT-4.5 treu una puntuació del 37,1%, més baixa que GPT-4o (61,8%), OpenAI o1 (44%) i, especialment, que OpenAI o3-mini (80,3%).

L’empresa assegura que GPT-4.5 té una millor comprensió de la comunicació humana i és més capaç de captar amb més traça pistes subtils o expectatives de resposta a partir del missatge. Aquesta fortalesa li permet, asseguren, decidir millor, en funció del context, si és més adient donar conversa a l’usuari o bé proveir-li informació. L’eina també presenta millores en creativitat i intuïció estètica, cosa que incrementa la seva utilitat en taques relacionades amb l’escriptura i el disseny. A més, prenent en compte diversos testos per avaluar models d’IA en diferents àmbits temàtics, GPT-4.5 millora 4o i o3-mini en les proves mutimodals i multilingües, i en una de les dues proves vinculades al codi. Això sí, o3-mini encara es mostra superior en les àrees més tècniques, com la ciència, les matemàtiques i l’altra prova de codi analitzada, gràcies al seu enfocament en el raonament profund.

Ara per ara, GPT-4.5 s’ofereix als usuaris en forma de xatbot amb la capacitat de buscar informació a la xarxa a través de Search, d’importar-li documents de text o imatge i de fer servir Canvas per treballar amb escriptura o codi. Tanmateix, la versió actual no suporta encara funcions multimodals com el mode de veu, el vídeo o l’anàlisi de captures de pantalla, tasques que es preveu incorporar en el futur. Per als desenvolupadors, el model ja es troba disponible per a tots els subscriptors de pagament i a diverses API, però atesa les seves exigències de computació s’ofereix a un preu elevat, de 75 dòlars el milió de tokens d’input. És per això que des d’OpenAI creuen que aquest model no és un reemplaçament directe per GPT-4o, que té un cost de 2,5 dòlars per milió de tokens d’input.