Intel·ligència artificial i xatbots: què en podem esperar?

Comparem ChatGPT, Copilot i Gemini per veure com funcionen, quina agilitat tenen i com solucionen els nostres dubtes

Categories:

Redacció

Els xatbots ja són una alternativa als cercadors tradicionals
Els xatbots ja són una alternativa als cercadors tradicionals | ChatGPT

La intel·ligència artificial i les diverses plataformes que empren els algoritmes per generar documents de text, imatge o veu han estat protagonistes del 2024. ChatGPT ja va despuntar l’any anterior, però els últims 12 mesos s’ha reforçat en paral·lel a l’ascens de més propostes com Gemini i Copilot. I és que no es tracta només de projectes amb uns fonaments sòlids, sinó de plataformes avalades per companyies com OpenAI, Google i Microsoft, respectivament. Això, clarament, avala el seu recorregut al mercat.

Malgrat que de mica en mica van guanyant territori com a eina principal de cerca, encara hi ha usuaris que no comprenen el valor diferencial que aporten respecte dels motors de cerca tradicional. Prenent com a exemple el cercador dominant al mercat, Google, aquest fa un rastreig de les pàgines web disponibles a la xarxa i les indexa en temps real. Els resultats que obté cada persona varien en funció de les preguntes prèvies fetes a la solució, el comportament amb ella, l’idioma, la localització i altres trets que caracteritzen l’ús que fa cada persona del cercador. Tot plegat, és informació clau perquè els algoritmes puguin predir quin és el resultat més bo segons el perfil personal. També es té en compte l’autoritat de les pàgines o la rellevància. A més a més, relaciona els continguts dels llocs web per mostrar textos, imatges, vídeos o qualsevol altre recurs que pugui ser d’interès en la cerca.

Tot i que existeixen una sèrie de pautes que defineixen com treballen els algoritmes i quins resultats apareixen, el cercador de Google no té en compte el context com sí que fan ChatGPT, Gemini i Copilot. Aquestes plataformes actuen com a xatbots que entenen les preguntes i generen respostes d'acord amb la conversa prèvia que s’ha mantingut. Això inclou des de la interpretació de les paraules emprades, fins a la generació de resultats sintètics que motiven més preguntes per acabar d’afinar el resultat final que es genera.

Tal com assenyalen fonts de Red Hat, les aplicacions d’IA es basen en models d’aprenentatge profund que recreen patrons obtinguts mitjançant un gran volum de dades utilitzats en l’entrenament dels algoritmes. “Posteriorment, treballen amb tot el coneixement adquirit dins dels paràmetres establerts per les persones que els entrenen amb l’objectiu de crear un producte nou. Els models d’aprenentatge profund no emmagatzemen una còpia de les dades d’entrenament, sinó una versió codificada en la qual estan organitzats segons la similitud entre elles. Això es pot descodificar per generar noves dades, però amb característiques similars”, expliquen. Tot el big data emprat en els entrenaments prové de dades obertes, d’internet i de qualsevol font que s’ofereixi per nodrir la tecnologia.

Un dels atributs que més es destaca de les plataformes d’IA generativa és la facilitat per accedir als enllaços que porten a les fonts d’informació. Cadascuna treballa de forma diferent d'acord amb l’entrenament rebut, però totes s’han estructurat de manera que garanteixen converses fluides i aporten dades que s’adeqüen més o menys a la resposta formulada inicialment. Per això, s’ha obert el debat respecte de com es faran les cerques en un futur: es presentaran qüestions i l’usuari continuarà navegant per les desenes o centenars de llocs que poden oferir la resposta, o bé tendirem cap a diàlegs amb xatbots que resoldran tots els dubtes? Mentre el dilema està servit, i sense una resposta clara, al mercat existeix una batalla intensa per veure qui aporta la innovació més gran; i qui aconsegueix perfeccionar més els algoritmes per evitar les al·lucinacions (respostes errònies o inventades per falta de dades de base).

Quina plataforma d’IA generativa és més eficient?

Aquesta és la pregunta clau. Per tal de fer una comparativa, hem fet la mateixa pregunta a ChatGPT, Gemini i Copilot: com funciona la tecnologia blockchain? Tots tres xatbots han ofert una resposta similar, amb la diferència que el tercer ha estat més sintètic. Els altres dos, han desgranat la mateixa informació, però amb una estructura diferenciada. Tot i això, plenament equiparable.

El diàleg amb els xatbots continua preguntant quan es va crear la cadena de blocs. Un cop més, tots tres fan esment de Satoshi Nakamoto i al bitcoin, però amb Copilot, de nou, amb el text més resumit i amb un enllaç directe als webs d’on s’ha extret la informació. A més a més, Gemini fa una passa més enrere i recula fins a la dècada dels 80 per parlar de la primera persona que va proposar un sistema de diners electrònics, en David Chaum.

En una tercera pregunta, li demanem si ens poden il·lustrar la tecnologia blockchain. El primer a oferir un resultat és Gemini, que a més a més recomana que li demanem que la perfeccioni. Ho fem i la fotografia final és similar, sense canvis substancials. Copilot no ofereix cap resultat, només mostra el missatge avisant que està generant la imatge. Si li demanem directament si és que no pot oferir-nos-en una, respon: “Sembla que hi ha hagut un petit problema tècnic, així que no puc generar una imatge en aquest moment. Però encara puc ajudar-te amb una descripció detallada!”. I això fa: oferir un text que relata com seria. ChatGPT tampoc genera una imatge, sinó que la descriu tal com fa Copilot, però és el segon xatbot a donar un resultat.

Si tot aquest exercici es fa amb el cercador tradicional de Google, el resultat és una llista de pàgines web que poden concordar amb la pregunta. La responsabilitat d’obtenir la informació desitjada, per tant, queda en mans de l’usuari. En la fase de demanar una imatge, no té la capacitat de generar-ne una de nova prenent com a base les dades extretes de la conversa prèvia.

Per acabar amb la prova, demanem si ens poden mostrar algun vídeo on expliquin i il·lustrin la blockchain. Tant Gemini com Copilot enllacen algunes propostes de YouTube, però ChatGPT es limita a donar de tres perfils de YouTube que en tenen, sense cap vincle que ens hi redirigeixi.

Es poden extreure conclusions?

Qualsevol xatbot, més enllà dels tres gegants que hem posat a prova, es troba encara en plena fase de desenvolupament. Existeixen versions diverses de cadascun d’ells, més o menys sofisticats, gratuïts o de pagament, i amb una base de dades més rica o una capacitat de resposta més ràpida. Com a conclusió ràpida, es pot afirmar que Copilot és qui sintetitza més la informació, cosa que permet tenir una resposta amb més agilitat, però potser coixa. També és el més lent, encara que amb una diferència molt petita. Segurament Gemini és el que més recursos ofereix en una mateixa plataforma si ens basem en aquesta prova, ja que ha generat dues imatges després d’haver conversat i haver obtingut informació prèvia.

Els models avancen a passes de gegants, així que la plataforma que avui és pionera, demà pot quedar obsoleta. Per aquest motiu, són molts els usuaris que n’empren dues o tres alhora per comparar els resultats. Això no només és positiu per tenir una actitud crítica davant les eines digitals i la intel·ligència artificial, sinó també per ajudar els desenvolupadors a millorar les solucions.