NotebookLM, l’eina intel·ligent de Google per prendre notes que ha cridat l’atenció del món del pòdcast
La nova funcionalitat ‘resums d’àudio’ permet convertir fitxers de text o en PDF en converses píndoles sonores locutades per veus artificials
Categories:
A principis d’estiu, Google va anunciar l’arribada a l’estat espanyol de NotebookLM, un assistent intel·ligent basat en el model Gemini 1.5 Pro pensat per tasques d’investigació i redacció a partir de diferents fonts d’informació: l’eina permet pujar un màxim de 50 documents de text, PDF, enllaços o presentacions i fer-li preguntes o demandes sobre ells. Tot i que fins ara no havia despertat molta atenció, la nova actualització que la plataforma va implementar a finals de setembre ha generat un gran interès per la seva relació amb els continguts sonors i visuals.
Basat en les capacitats multimodals de Gemini 1.5 Pro, NotebookLM és ara capaç d’acceptar els vídeos de YouTube com a fonts d’informació, a més a més dels textos provinents de diferents formats. No només això, sinó que també pot generar resums d’àudio de tota la documentació introduïda i presentar-la en forma de pòdcast informal entre dues veus. Aquesta darrera característica es troba encara en fase experimental i només produeix resultats en anglès (tot i que les fonts d’informació poden estar en altres idiomes, incloent-hi el català), però ha sorprès la comunitat digital per la seva semblança amb les converses reals.
L’eina ha estat lloada per perfils com Andrej Karpathy, creador d’Eureka Labs i un dels fundadors originals d’OpenAI, qui ha comparat la capacitat de generar pòdcasts de NotebookLM amb l’impacte que va produir el llançament inicial de ChatGPT. Una comparació que també recull el fundador de Pathaka Shiv Malik: “NotebookLM de Google és sorprenent. Realment màgic. Potser més que ChatGPT quan es va llançar”. L’emprenedor incorpora com a prova del potencial de l’eina el resum d’àudio que ha generat a partir d’un poema escrit per la seva filla de 10 anys.
Google's NotebookLM is astounding. It's truly magical. More perhaps than ChatGPT was when it came out.
— Shiv Malik (@shivmalik) October 2, 2024
My 10 year old daughter and I converted one of her school poems into a podcast. Here's the result. It's a really thorough, enjoyable conversation. Full of context. It broke… pic.twitter.com/eK2yAmCLbQ
Des de Google han alertat que les converses generades “no són una visió exhaustiva o objectiva sobre un tema”, sinó un reflex de les fonts aportades. A més, en trobar-se encara en una fase experimental i estar basades en un model d’IA, els resultats poden incloure errors, imprecisions i al·lucinacions. D’altra banda, l’eina no ofereix la mateixa velocitat de resultats que altres assistents intel·ligents, especialment quan ha de generar un resum d’àudio, tasca que pot trigar diversos minuts a finalitzar.