Il contenuto taggato con metadati e supportato da una tassonomia diventa più gestibile, individuabile e condivisibile. I metadati sono più ampi di una tassonomia, ma una tassonomia è più profonda dei soli metadati. Ecco perché occorre progettare una strategia integrata
Sappiamo tutti che i dati sono importanti e crescono in modo esponenziale. Ecco perché sono sempre più preziosi i metadati, che sono informazioni di riepilogo sui dati. Tuttavia, se pensiamo ai metadati semplicemente come a una sorta di “dati sui dati”, potremmo pensare che siano rilevanti solo per la gestione dei dati e lasciare la gestione dei metadati alle persone che gestiscono i database o i sistemi di gestione di database. Ma in realtà i metadati sono molto più di questo e la responsabilità è quindi maggiore.
I metadati sono dati realmente standardizzati su qualsiasi cosa abbia attributi condivisi che vanno organizzati e recuperati. Questi possono essere documenti, fogli di calcolo, file di presentazione, immagini, file multimediali o file specializzati, come disegni tecnici. I documenti e i contenuti digitali tendono a trovarsi all’interno di un sistema di informazioni o file system. Ciò non è limitato, tuttavia, ai sistemi di gestione del database, ma comprende il sistema di gestione dei contenuti, il sistema di gestione dei documenti, i sistemi di gestione delle risorse digitali, i sistemi di creazione e pubblicazione, i sistemi di collaborazione, i sistemi intranet e i sistemi di gestione dei workflow e dei progetti, oltre a quelli che sono forme di sistemi di gestione di database, come i CRM e i sistemi di gestione delle informazioni sui prodotti. Non è difficile apprendere una buona gestione dei metadati, ma richiede un piccolo sforzo e attenzione. Le basi includono la creazione di metadati completi, coerenti, giustificati da casi d’uso e facili da usare.
Il ruolo crescente delle tassonomie
Le tassonomie sono sistemazioni organizzate di termini/concetti controllati, associati ai contenuti per facilitare la ricerca e il recupero del contenuto desiderato. Le persone usano le tassonomie per trovare i concetti che desiderano, ma non devono fare affidamento solo su corrispondenze di parole chiave, che a volte risultano inadeguate o imprecise. Le tassonomie sono spesso pensate come sistemi di classificazione, come quelli utilizzati nelle biblioteche, nelle raccolte di ricerche, nelle statistiche governative o nelle specifiche di produzione. Le tassonomie possono essere personalizzate in base a un insieme di contenuti, alle esigenze dei diversi utenti e ai requisiti di un sistema e della relativa interfaccia utente. Conosciamo tutti le tassonomie per la ricerca di prodotti nei siti di e-commerce, ma ogni negozio online ha un diverso insieme di prodotti e quindi una diversa tassonomia. Probabilmente abbiamo tutti notato categorie, tag e filtri su siti web, intranet e vari sistemi di informazione, che a volte funzionano bene e a volte no. Ciò dipende dalla presenza o meno di una tassonomia ben progettata dietro la struttura di categorie, tag o filtri. In realtà, le tassonomie possono essere implementate nella maggior parte degli stessi sistemi che utilizzano i metadati. Per questo motivo, tassonomie e metadati vanno spesso progettati insieme.
La connessione tra metadati e tassonomie
In una determinata implementazione, i metadati sono organizzati in tipi, chiamati anche proprietà, elementi o campi, che sono comuni in un insieme di contenuti. Per ogni singolo elemento di contenuto, esistono valori distinti per ciascuna proprietà di metadati. I valori possono essere testo, date, numeri o un semplice booleano sì/no. Il testo può essere una descrizione, un titolo o una parola chiave. Le parole chiave possono essere aperte e create dall’utente, oppure possono essere limitate a termini in un vocabolario controllato. La maggior parte delle tassonomie (ma non tutte) servono a popolare i termini/valori nei campi/elementi dei metadati; e alcuni campi dei metadati (ma non tutti) sono popolati da termini/valori di vocabolari controllati.
In sintesi, uno schema di metadati ha più ampiezza, mentre una tassonomia ha più profondità. La definizione di “tassonomia” non è rigorosa. Sebbene tradizionalmente significhi una disposizione gerarchica dei termini in relazioni più ampie/più ristrette, un insieme di più proprietà dei metadati e dei loro valori, anche se non c’è ulteriore gerarchia, può anche essere considerato una tassonomia. È considerata una tassonomia in quanto esiste un’organizzazione strutturata di termini in varie proprietà dei metadati che si applicano allo stesso insieme di contenuti.
Progettare tassonomie e metadati insieme
Resta la questione se iniziare con la creazione della strategia e dello schema generale dei metadati e quindi creare tassonomie secondo necessità, o iniziare con la creazione di una tassonomia e poi, nel corso del processo, identificare i vari metadati descrittivi che richiedono vocabolari controllati. Idealmente, i due elementi vengono sviluppati per la combinazione di implementazione, come parte di una strategia integrata. Tuttavia, un esperto nello sviluppo della tassonomia (un tassonomista) e un esperto nella progettazione dei metadati (un architetto dei metadati) di solito non sono la stessa persona. Un architetto di metadati può progettare tassonomie e un tassonomista può progettare metadati oppure i due esperti possono lavorare insieme allo stesso progetto. In realtà, è raro che un’organizzazione disponga di entrambi questi esperti nel proprio staff. Il fatto che un’organizzazione abbia un architetto o un tassonomista dei metadati dipende dalla natura dei contenuti dell’organizzazione e dalle esigenze dell’organizzazione dei contenuti. Una tassonomia gerarchica può essere integrata con i metadati, quando uno dei campi dei metadati è per “argomento” o per “oggetto” ed esiste una tassonomia gerarchica dei termini del soggetto associati a quel campo. Tuttavia, è in particolare il tipo sfaccettato di tassonomia che unisce i compiti di creazione della tassonomia e progettazione dei metadati.
Tassonomie sfaccettate e metadati
Una tassonomia sfaccettata comprende una serie di sfaccettature, ciascuna come un vocabolario controllato individuale i cui termini generalmente non sono collegati/correlati a termini nelle altre sfaccettature del vocabolario controllato, ma la combinazione di termini da una combinazione di sfaccettature viene utilizzata per etichettare lo stesso insieme di contenuto e gli utenti cercano/filtrano i termini in combinazione da varie sfaccettature. Esempi di sfaccettature possono essere prodotto/servizio, segmento di mercato, luogo, tipo di documento, fornitore, e così via. Una tassonomia sfaccettata è un tipo comune sia per le tassonomie aziendali sia per le tassonomie di e-commerce o di recensione dei prodotti. Si chiama “tassonomia” anche se differisce dal classico tipo di tassonomia gerarchica “ad albero”, perché implica un vocabolario controllato e una classificazione. Il nome di ogni sfaccettatura e i termini all’interno della sfaccettatura costituiscono semplicemente una gerarchia a due livelli. Ogni aspetto è anche un campo/elemento di metadati. La persona che progetta una tassonomia sfaccettata sta quindi progettando anche metadati, o almeno alcuni. Di solito ci sono più campi di metadati per descrivere il contenuto oltre a quelli che comprendono gli aspetti della tassonomia. Per fare in modo che una tassonomia sfaccettata possa servire al meglio l’utente che sta cercando di trovare contenuti in base a cosa sono e di cosa si tratta, il numero di sfaccettature dovrebbe essere limitato, per esempio 4-8.
D’altra parte, potrebbero esserci campi di metadati aggiuntivi oltre l’ambito e la definizione di “tassonomia” che sono tuttavia resi disponibili all’utente finale per filtrare/perfezionare i risultati insieme agli altri aspetti della tassonomia. A volte, la distinzione tra l’aspetto della tassonomia e altri metadati in questo caso non è così chiara, come per il tipo di documento/contenuto, il pubblico o la lingua, quando questi campi utilizzano vocabolari controllati. Proprio a causa di questa sovrapposizione e distinzione sfocata tra le sfaccettature della tassonomia e i metadati visualizzati per il filtraggio, è una buona idea progettare la tassonomia e i metadati insieme come una strategia integrata.
Heather Hedden
Esperta di tassonomia e consulente indipendente. Attualmente, lavora per il team di servizi professionali di Semantic Web Company. Precedentemente, è stata editor senior di vocabolario per un editore didattico, tassonomista per uno sviluppatore di software per motori di ricerca enterprise, e docente per la Simmons University School of Library and Information Science. È autrice del libro “The Accidental Taxonomist”, giunto alla seconda edizione.
Heather Hedden presenterà per Technology Transfer il seminario “Design di Tassonomia e Metadati” che si terrà a Roma il 29-30 marzo 2021.