IBM e UE insieme per la ricerca Web

E se trovare parti di ricambio o identificare un punto di riferimento fosse tanto facile quanto caricare e analizzare una foto digitale? Presto sarà possibile grazie alla tecnologia sviluppata da un progetto dell’Unione Europea guidato dalla divisione di Ricerca IBM.

In collaborazione con un Consorzio dell’Unione Europea, i ricercatori IBM hanno sviluppato un motore di ricerca analitico che consente di trovare video, immagini e musica, non contrassegnati con informazioni descrittive (tag), che corrispondano a dati multimediali sottoposti come query.

TI PIACE QUESTO ARTICOLO?

Iscriviti alla nostra newsletter per essere sempre aggiornato.

Il consorzio ha ideato una tecnologia Web chiamata SAPIR (Search in Audio visual content using Peer-to-peer Information Retrieval) capace di analizzare e identificare i pixel in grandi archivi costituiti da contenuti audiovisivi. Ad esempio, è in grado di analizzare una foto digitalizzata o i bitstream in un file audio elettronico anche se non sono stati contrassegnati o indicizzati con tag. Il multimedia identificato viene automaticamente indicizzato e ordinato per essere poi facilmente reperito.

“SAPIR è un potenziale ‘game-changer’ per quanto riguarda la scalabilità nella ricerca e nelle analisi”, ha affermato Yosi Mass, specialista presso IBM Research-Haifa e project leader per SAPIR. “Affronta il problema da una prospettiva fondamentalmente diversa ed apre un universo di nuove possibilità all’uso dei multimedia per analizzare il vasto mondo visivo e acustico nel quale viviamo”.

SAPIR
(www.sapir.eu) è in grado di indicizzare ed analizzare archivi costituiti da milioni elementi multimediali, estraendo i “descrittori base” da fotografie o video. Questi descrittori comprendono caratteristiche quali il colore, il layout, le forme o i suoni.

Se, ad esempio, un turista usa un telefono cellulare per fotografare una statua, SAPIR ne identifica i descrittori, li confronta con le fotografie esistenti ed aiuta a identificare la statua. Con ulteriori ricerche, potrebbero essere analizzate caratteristiche più specifiche, in modo tale che, ad esempio, potrebbe essere possibile fotografare un elemento di abbigliamento alla moda, visto in qualche vetrina, e scoprire in quali negozi poterlo acquistare.

Leggi anche:  Threads arriverà il 14 dicembre in Europa

In futuro, i ricercatori IBM potrebbero essere in grado di estendere la potenza della scalabilità di SAPIR per usarlo, ad esempio, come ausilio nell’assistenza sanitaria analizzando immagini mediche e documentazioni dei pazienti per proporre diagnosi verosimili confrontando i risultati con dati storici estratti da archivi medici distribuiti.

I file multimediali costituiscono la stragrande maggioranza dei dati disponibili su Internet e, da uno studio di IDC del maggio 2009, emerge che il 95% delle informazioni in formato elettronico, come ad esempio le foto digitali, non è ben categorizzato od identificato da tag. Le immagini, catturate da più di 1 miliardo di dispositivi nel mondo, costituiscono la parte maggiore dell’universo digitale.

Ad esempio, nel 2006 il numero di immagini raccolte con telefoni cellulari ha quasi raggiunto i 100 miliardi e si prevede che si arrivi a 500 miliardi entro il 2010.

SAPIR attinge i suoi dati in questo vasto repertorio elettronico multimediale in continua crescita ed ha un’affidabilità eccezionale e capacità pressoché illimitate. E’ basato sulla stessa architettura peer-to-peer che viene utilizzata anche per lo scambio di audio e video su Internet.

Con questo approccio, non esiste un singolo elemento che, a seguito di un guasto, possa portare al malfunzionamento dell’intero sistema ed è possibile aggiungere risorse per aumentarne la capacità a fronte di un aumento dei dati da analizzare. La “freschezza” del materiale indicizzato e ordinato è garantita dal fatto che i provider di contenuti inseriscano automaticamente il proprio materiale nell’archivio.