NotebookLM, l’eina intel·ligent de Google per prendre notes que ha cridat l’atenció del món del pòdcast

La nova funcionalitat ‘resums d’àudio’ permet convertir fitxers de text o en PDF en converses píndoles sonores locutades per veus artificials

Categories:

Redacció

Nascuda com una eina per fer consultes especialitzades basades en les fonts aportades, NotebookLM ha guanyat popularitat per funcionalitat de generar pòdcasts d'aquests temes
Nascuda com una eina per fer consultes especialitzades basades en les fonts aportades, NotebookLM ha guanyat popularitat per funcionalitat de generar pòdcasts d'aquests temes | Google

A principis d’estiu, Google va anunciar l’arribada a l’estat espanyol de NotebookLM, un assistent intel·ligent basat en el model Gemini 1.5 Pro pensat per tasques d’investigació i redacció a partir de diferents fonts d’informació: l’eina permet pujar un màxim de 50 documents de text, PDF, enllaços o presentacions i fer-li preguntes o demandes sobre ells. Tot i que fins ara no havia despertat molta atenció, la nova actualització que la plataforma va implementar a finals de setembre ha generat un gran interès per la seva relació amb els continguts sonors i visuals.

Basat en les capacitats multimodals de Gemini 1.5 Pro, NotebookLM és ara capaç d’acceptar els vídeos de YouTube com a fonts d’informació, a més a més dels textos provinents de diferents formats. No només això, sinó que també pot generar resums d’àudio de tota la documentació introduïda i presentar-la en forma de pòdcast informal entre dues veus. Aquesta darrera característica es troba encara en fase experimental i només produeix resultats en anglès (tot i que les fonts d’informació poden estar en altres idiomes, incloent-hi el català), però ha sorprès la comunitat digital per la seva semblança amb les converses reals.

L’eina ha estat lloada per perfils com Andrej Karpathy, creador d’Eureka Labs i un dels fundadors originals d’OpenAI, qui ha comparat la capacitat de generar pòdcasts de NotebookLM amb l’impacte que va produir el llançament inicial de ChatGPT. Una comparació que també recull el fundador de Pathaka Shiv Malik: “NotebookLM de Google és sorprenent. Realment màgic. Potser més que ChatGPT quan es va llançar”. L’emprenedor incorpora com a prova del potencial de l’eina el resum d’àudio que ha generat a partir d’un poema escrit per la seva filla de 10 anys.

Des de Google han alertat que les converses generades “no són una visió exhaustiva o objectiva sobre un tema”, sinó un reflex de les fonts aportades. A més, en trobar-se encara en una fase experimental i estar basades en un model d’IA, els resultats poden incloure errors, imprecisions i al·lucinacions. D’altra banda, l’eina no ofereix la mateixa velocitat de resultats que altres assistents intel·ligents, especialment quan ha de generar un resum d’àudio, tasca que pot trigar diversos minuts a finalitzar.