Nuclia posa ordre en el garbuix de dades de les empreses

La ‘start-up’ catalana ha creat una API que permet trobar una resposta a una pregunta específica en poc temps i utilitzant conceptes clau

Categories:

Oriol Quintana

L’aplicació indexa tota mena de contingut i el guarda en un buscador semàntic, independentment del format o la llengua d’aquests
L’aplicació indexa tota mena de contingut i el guarda en un buscador semàntic, independentment del format o la llengua d’aquests | Pixabay (Pexels)

Al llarg de la jornada laboral, en una empresa es genera una gran quantitat d’informació. Correus electrònics, documents o videotrucades són d’allò més habituals. Al cap d’un temps, totes aquelles dades generades es perden al núvol, en la majoria d’ocasions, i és d’allò més difícil trobar un arxiu que ens doni resposta a una necessitat concreta. Això és precisament el que soluciona Nuclia, una start-up catalana amb l’objectiu d’evitar aquesta pèrdua de temps incorporant un cercador capaç de trobar resposta a qualsevol pregunta en poc temps i a través de conceptes clau.

“El nostre producte és una API, una interfície de programació d'aplicacions, que soluciona un problema que la majoria d’organitzacions tenen avui en dia: l’accés a la informació no estructurada”, resumeix el director general de Nuclia, Eudald Camprubí. I aclareix: “Informació no estructurada és, per exemple, un PDF, un vídeo, un document Word… Es troben disperses al núvol i el fet de tenir-les en formats i llocs diferents fa que sigui un martiri i una frustració trobar allò que busques”.

Camprubí: “Ens trobem amb informació no estructurada dispersa al núvol i el fet de tenir-la en formats i llocs diferents fa que buscar-la es converteixi en un martiri i frustració”

Per ficar ordre, fan ús de la intel·ligència artificial, una tecnologia amb la qual es van iniciar els fundadors el 2016, tres anys abans de crear l’empresa. El seu mètode de funcionament és indexar tot el contingut, en el cas dels vídeos extreure la transcripció, i guardar-ho tot en un buscador semàntic, independentment del format o la llengua utilitzada. D’aquesta manera, introduint un concepte clau i específic, es poden trobar dins de qualsevol document els paràgrafs específics en llenguatge natural.

En ser una API, obre la possibilitat a les empreses de desenvolupar aplicacions partint de la base de Nuclia. De moment, els sectors que més interès han mostrat són el financer, el salut i l’educatiu. L’objectiu és facilitar qualsevol mena de cerca i, per això, han introduït un cercador en forma de xatbot, que Camprubí compara amb ChatGPT. “Per generar una resposta més senzilla i directa, introduïm un xat intern per a les empreses. Se li fa una pregunta concreta i entre tota la informació, es genera una resposta directa del que es busca”.

Indexació de pòdcasts

L’API de Nuclia també permet a les companyies indexar pòdcasts. El director general explica: “Es pot indexar qualsevol fitxer. En el cas de l’àudio, el transcrivim a qualsevol idioma. Un cop el tenim, a través d’un algoritme partim la informació en paràgrafs i els vectoritzem. Així doncs, si es fa una pregunta on les dades es troben dins de la peça d’àudio, no només et generarà la resposta, sinó que et dirà els minuts concrets que es dediquen al tema”.