Amazon entra a la cursa de la IA generativa amb Nova
El gegant tecnològic presenta una familia de quatre models fundacionals multimodals i dos models generatius, un d’imatge i un de vídeo
Categories:
Després de l’èxit de ChatGPT i les apostes de Google, Microsoft i Apple amb Gemini, Copilot i Apple Intelligence, respectivament, Amazon era de les poques grans tecnològiques que encara no havia fet el salt a la intel·ligència artificial generativa. Una situació que ha acabat aquest dimarts amb la presentació de Nova, la nova línia de models fundacionals i multimodals del gegant del comerç electrònic. Segons l’evangelista en cap per Europa, Àfrica i Orient Mitjà d’Amazon, Danilo Poccia, Amazon Nova permet reduir els costos i la latència de gairebé qualsevol tasca que impliqui IA generativa quan es compara amb altres eines de l’estil.
La família de models de llenguatge de Nova es divideix en dos grans grups: els models fundacionals o de comprensió, i els models de generació de continguts creatius. Els primers conformen una família de quatre models ordenats en funció de les seves capacitats: Amazon Nova Micro, que només pot rebre i reproduir text i pot processar un context de fins a 128.000 tokens; Amazon Nova Lite, que accepta també imatge i vídeo, amb un context de fins a 300.000 tokens, però només pot contestar amb text; Amazon Nova Pro, que pot rebre i reproduir text, imatge i vídeo, i Amazon Nova Premier, que es troba encara en entrenament i serà el més potent dels quatre. Els tres primers ja es troben disponibles a través d’Amazon Bedrock, mentre que Premier arribarà durant el 2025. Tots ells són compatibles amb més de 200 idiomes, tot i que estan optimitzats per 15 (entre els quals hi ha el castellà, però no el català).
La multinacional també ha presentat Amazon Nova Canvas i Amazon Nova Reel, models generatius d’imatges i vídeos, respectivament. Canvas permet produir imatges “de qualitat d’estudi” amb un control sobre l’estil i el contingut, a més a més d’eines de restauració d’imatge, ampliació dels marges i eliminació de fons. Per la seva banda, Reel permet generar vídeos de curta durada a partir dels apunts de text i les imatges que s’introdueixin, a més a més d’oferir un control sobre l’aspecte visual i el ritme dels resultats. Tant Canvas com Reel inclouen funcionalitats per introduir marques d’aigua als seus resultats, amb la intenció de “promoure l’ús responsable de la IA”. Tanmateix, ara per ara només són compatibles amb l’anglès.