Visibilità e discovery. Come disegnare metadati e tassonomie

Design di tassonomia e metadati alla base dell’architettura dell’informazione

Il contenuto taggato con metadati e supportato da una tassonomia diventa più gestibile, individuabile e condivisibile. I metadati sono più ampi di una tassonomia, ma una tassonomia è più profonda dei soli metadati. Ecco perché occorre progettare una strategia integrata

Sappiamo tutti che i dati sono importanti e crescono in modo esponenziale. Ecco perché sono sempre più preziosi i metadati, che sono informazioni di riepilogo sui dati. Tuttavia, se pensiamo ai metadati semplicemente come a una sorta di “dati sui dati”, potremmo pensare che siano rilevanti solo per la gestione dei dati e lasciare la gestione dei metadati alle persone che gestiscono i database o i sistemi di gestione di database. Ma in realtà i metadati sono molto più di questo e la responsabilità è quindi maggiore.

TI PIACE QUESTO ARTICOLO?

Iscriviti alla nostra newsletter per essere sempre aggiornato.

I metadati sono dati realmente standardizzati su qualsiasi cosa abbia attributi condivisi che vanno organizzati e recuperati. Questi possono essere documenti, fogli di calcolo, file di presentazione, immagini, file multimediali o file specializzati, come disegni tecnici. I documenti e i contenuti digitali tendono a trovarsi all’interno di un sistema di informazioni o file system. Ciò non è limitato, tuttavia, ai sistemi di gestione del database, ma comprende il sistema di gestione dei contenuti, il sistema di gestione dei documenti, i sistemi di gestione delle risorse digitali, i sistemi di creazione e pubblicazione, i sistemi di collaborazione, i sistemi intranet e i sistemi di gestione dei workflow e dei progetti, oltre a quelli che sono forme di sistemi di gestione di database, come i CRM e i sistemi di gestione delle informazioni sui prodotti. Non è difficile apprendere una buona gestione dei metadati, ma richiede un piccolo sforzo e attenzione. Le basi includono la creazione di metadati completi, coerenti, giustificati da casi d’uso e facili da usare.

Il ruolo crescente delle tassonomie

Le tassonomie sono sistemazioni organizzate di termini/concetti controllati, associati ai contenuti per facilitare la ricerca e il recupero del contenuto desiderato. Le persone usano le tassonomie per trovare i concetti che desiderano, ma non devono fare affidamento solo su corrispondenze di parole chiave, che a volte risultano inadeguate o imprecise. Le tassonomie sono spesso pensate come sistemi di classificazione, come quelli utilizzati nelle biblioteche, nelle raccolte di ricerche, nelle statistiche governative o nelle specifiche di produzione. Le tassonomie possono essere personalizzate in base a un insieme di contenuti, alle esigenze dei diversi utenti e ai requisiti di un sistema e della relativa interfaccia utente. Conosciamo tutti le tassonomie per la ricerca di prodotti nei siti di e-commerce, ma ogni negozio online ha un diverso insieme di prodotti e quindi una diversa tassonomia. Probabilmente abbiamo tutti notato categorie, tag e filtri su siti web, intranet e vari sistemi di informazione, che a volte funzionano bene e a volte no. Ciò dipende dalla presenza o meno di una tassonomia ben progettata dietro la struttura di categorie, tag o filtri. In realtà, le tassonomie possono essere implementate nella maggior parte degli stessi sistemi che utilizzano i metadati. Per questo motivo, tassonomie e metadati vanno spesso progettati insieme.

La connessione tra metadati e tassonomie

In una determinata implementazione, i metadati sono organizzati in tipi, chiamati anche proprietà, elementi o campi, che sono comuni in un insieme di contenuti. Per ogni singolo elemento di contenuto, esistono valori distinti per ciascuna proprietà di metadati. I valori possono essere testo, date, numeri o un semplice booleano sì/no. Il testo può essere una descrizione, un titolo o una parola chiave. Le parole chiave possono essere aperte e create dall’utente, oppure possono essere limitate a termini in un vocabolario controllato. La maggior parte delle tassonomie (ma non tutte) servono a popolare i termini/valori nei campi/elementi dei metadati; e alcuni campi dei metadati (ma non tutti) sono popolati da termini/valori di vocabolari controllati.

Leggi anche:  Qlik amplia la capacità dei clienti di scalare l'AI per un impatto con AWS

In sintesi, uno schema di metadati ha più ampiezza, mentre una tassonomia ha più profondità. La definizione di “tassonomia” non è rigorosa. Sebbene tradizionalmente significhi una disposizione gerarchica dei termini in relazioni più ampie/più ristrette, un insieme di più proprietà dei metadati e dei loro valori, anche se non c’è ulteriore gerarchia, può anche essere considerato una tassonomia. È considerata una tassonomia in quanto esiste un’organizzazione strutturata di termini in varie proprietà dei metadati che si applicano allo stesso insieme di contenuti.

Progettare tassonomie e metadati insieme

Resta la questione se iniziare con la creazione della strategia e dello schema generale dei metadati e quindi creare tassonomie secondo necessità, o iniziare con la creazione di una tassonomia e poi, nel corso del processo, identificare i vari metadati descrittivi che richiedono vocabolari controllati. Idealmente, i due elementi vengono sviluppati per la combinazione di implementazione, come parte di una strategia integrata. Tuttavia, un esperto nello sviluppo della tassonomia (un tassonomista) e un esperto nella progettazione dei metadati (un architetto dei metadati) di solito non sono la stessa persona. Un architetto di metadati può progettare tassonomie e un tassonomista può progettare metadati oppure i due esperti possono lavorare insieme allo stesso progetto. In realtà, è raro che un’organizzazione disponga di entrambi questi esperti nel proprio staff. Il fatto che un’organizzazione abbia un architetto o un tassonomista dei metadati dipende dalla natura dei contenuti dell’organizzazione e dalle esigenze dell’organizzazione dei contenuti. Una tassonomia gerarchica può essere integrata con i metadati, quando uno dei campi dei metadati è per “argomento” o per “oggetto” ed esiste una tassonomia gerarchica dei termini del soggetto associati a quel campo. Tuttavia, è in particolare il tipo sfaccettato di tassonomia che unisce i compiti di creazione della tassonomia e progettazione dei metadati.

Tassonomie sfaccettate e metadati

Una tassonomia sfaccettata comprende una serie di sfaccettature, ciascuna come un vocabolario controllato individuale i cui termini generalmente non sono collegati/correlati a termini nelle altre sfaccettature del vocabolario controllato, ma la combinazione di termini da una combinazione di sfaccettature viene utilizzata per etichettare lo stesso insieme di contenuto e gli utenti cercano/filtrano i termini in combinazione da varie sfaccettature. Esempi di sfaccettature possono essere prodotto/servizio, segmento di mercato, luogo, tipo di documento, fornitore, e così via. Una tassonomia sfaccettata è un tipo comune sia per le tassonomie aziendali sia per le tassonomie di e-commerce o di recensione dei prodotti. Si chiama “tassonomia” anche se differisce dal classico tipo di tassonomia gerarchica “ad albero”, perché implica un vocabolario controllato e una classificazione. Il nome di ogni sfaccettatura e i termini all’interno della sfaccettatura costituiscono semplicemente una gerarchia a due livelli. Ogni aspetto è anche un campo/elemento di metadati. La persona che progetta una tassonomia sfaccettata sta quindi progettando anche metadati, o almeno alcuni. Di solito ci sono più campi di metadati per descrivere il contenuto oltre a quelli che comprendono gli aspetti della tassonomia. Per fare in modo che una tassonomia sfaccettata possa servire al meglio l’utente che sta cercando di trovare contenuti in base a cosa sono e di cosa si tratta, il numero di sfaccettature dovrebbe essere limitato, per esempio 4-8.

Leggi anche:  Sanità, così l’innovazione può migliorare l’assistenza ai pazienti

D’altra parte, potrebbero esserci campi di metadati aggiuntivi oltre l’ambito e la definizione di “tassonomia” che sono tuttavia resi disponibili all’utente finale per filtrare/perfezionare i risultati insieme agli altri aspetti della tassonomia. A volte, la distinzione tra l’aspetto della tassonomia e altri metadati in questo caso non è così chiara, come per il tipo di documento/contenuto, il pubblico o la lingua, quando questi campi utilizzano vocabolari controllati. Proprio a causa di questa sovrapposizione e distinzione sfocata tra le sfaccettature della tassonomia e i metadati visualizzati per il filtraggio, è una buona idea progettare la tassonomia e i metadati insieme come una strategia integrata.


Heather Hedden

Esperta di tassonomia e consulente indipendente. Attualmente, lavora per il team di servizi professionali di Semantic Web Company. Precedentemente, è stata editor senior di vocabolario per un editore didattico, tassonomista per uno sviluppatore di software per motori di ricerca enterprise, e docente per la Simmons University School of Library and Information Science. È autrice del libro “The Accidental Taxonomist”, giunto alla seconda edizione.

Heather Hedden presenterà per Technology Transfer il seminario “Design di Tassonomia e Metadati” che si terrà a Roma il 29-30 marzo 2021.