Metadati e tassonomie, il cuore della governance dei contenuti

Design di tassonomia e metadati alla base dell’architettura dell’informazione

Metadati e tassonomie come pilastri per la struttura, il controllo, la supervisione e la qualità delle informazioni. Regole e procedure per le corretta gestione e manutenzione. Il ruolo critico della governance per l’ottimizzazione dei processi e la compliance

Tanto i metadati quanto le tassonomie sono strumenti per organizzare, gestire e recuperare vari tipi di contenuti digitali, come documenti, presentazioni, immagini, video e disegni tecnici. I metadati rappresentano informazioni standardizzate sui contenuti e sono composti da attributi comuni, come nome del file, autore, formato, tipo di contenuto, lingua e altro. Questi attributi vengono popolati con valori specifici e applicati ai contenuti per scopi diversi, tra cui pubblicazione, promozione, gestione dei flussi di lavoro, recupero, confronto e archiviazione. Le tassonomie sono insiemi di termini controllati disposti in modo gerarchico (collegati tra loro attraverso relazioni più ampie o più strette) o raggruppati per categoria o tipo.

TI PIACE QUESTO ARTICOLO?

Iscriviti alla nostra newsletter per essere sempre aggiornato.

Le tassonomie vengono di solito implementate come valori per alcune proprietà dei metadati che richiedono un alto grado di dettaglio, come soggetto, attività, categoria di prodotto, settore o specializzazione. I termini all’interno della tassonomia vengono utilizzati per descrivere il contenuto. Il contenuto stesso viene etichettato con i termini della tassonomia in modo che le persone possano trovarlo in base agli argomenti trattati. I metadati forniscono la struttura ai contenuti e le tassonomie sono parte di questa struttura che consente di recuperare i contenuti in base al loro significato. Poiché le tassonomie fanno parte dei metadati, la governance delle tassonomie fa parte della governance dei metadati.

La governance: di cosa si tratta e perché è importante

La governance rappresenta l’esercizio di controllo nella gestione di risorse come dati, metadati e tassonomie. Si propone di garantire qualità, coerenza e utilità non solo di queste risorse, ma anche della loro efficacia nell’ambito della gestione e del recupero dei contenuti. Include policy e procedure per l’utilizzo e la gestione continue di metadati e tassonomie. La governance dei metadati e delle tassonomie ha due componenti: la definizione di una policy su come devono essere gestiti (le regole) e la definizione delle procedure per la gestione e la manutenzione dei metadati. La definizione di una policy su come devono essere i metadati implica la definizione delle proprietà dei metadati, delle loro descrizioni, degli usi, delle regole e dei tipi di valori per ciascuna proprietà. La definizione di una policy su come deve essere la tassonomia implica la definizione del tipo di tassonomia, dei livelli di profondità della gerarchia, dell’uso di sinonimi, dell’uso di note o definizioni sui termini e dello stile editoriale (come per esempio l’uso del maiuscolo e altri aspetti) per i nomi dei termini.

Leggi anche:  Realtà e miti dell'intelligenza artificiale: le previsioni di SAS per il 2024

L’impostazione delle procedure di gestione e manutenzione riguarda le modifiche e gli aggiornamenti dei metadati e della tassonomia. Ciò è necessario per preservare la coerenza di fronte ai cambiamenti e per mitigare i rischi connessi. Questa parte della governance coinvolge anche i soggetti interessati, gli stakeholder. La definizione di una procedura per la gestione dei metadati e delle tassonomie include la definizione dei ruoli, delle responsabilità e dei processi. Ciò include la procedura per apportare e approvare modifiche e aggiunte e i ruoli di chi prende le decisioni e approva le decisioni per i diversi tipi di modifiche, tra cui le modifiche alle proprietà dei metadati, le modifiche alle regole dei metadati, le modifiche ai valori del vocabolario controllato.

Governance dei metadati vs tassonomie

La governance dei metadati è integrata nello schema dei metadati e comprende specifiche dettagliate sulle proprietà dei metadati, come i tipi di valori gestiti, limiti di caratteri, l’uso di vocabolari controllati e altro. Questa governance definisce come i metadati dovrebbero essere implementati ma spesso non include procedure di aggiornamento. D’altra parte, la governance delle tassonomie richiede un piano esterno che definisca come dovrebbe essere progettata la tassonomia. Questa governance dovrebbe essere sviluppata contemporaneamente alla tassonomia e dovrebbe includere processi per l’aggiunta e la modifica dei termini del vocabolario controllato. La parte più critica della governance delle tassonomie riguarda le procedure di manutenzione, poiché le tassonomie sono suscettibili di cambiamenti e aggiornamenti frequenti. Questo coinvolge l’aggiunta di nuovi termini in risposta a tendenze, nuovi contenuti o feedback degli utenti. La governance delle tassonomie dovrebbe definire i tipi di modifiche, i livelli di approvazione necessari, i processi di presentazione delle richieste, le fonti autorevoli e i criteri per l’aggiunta di nuovi termini. Questo aspetto è particolarmente cruciale per le tassonomie a causa della loro complessità e dettaglio.

Gli standard per i metadati e le tassonomie

Anche gli standard possono contribuire a supportare la governance, ma esistono diversi tipi di standard per diversi scopi. Gli standard per i metadati e quelli per le tassonomie sono molto diversi. Il termine “standard di metadati” si riferisce generalmente a schemi di metadati specifici e pubblicati, spesso sviluppati da una comunità di utenti per un certo tipo di risorsa e incoraggiati a essere adottati dalle organizzazioni che gestiscono quel tipo di risorsa. Lo standard enumera e definisce tutte le proprietà dei metadati. Tra gli esempi vi sono MARC e MODS per le biblioteche, IPTC (International Press Telecommunications Council) per le fotografie e Dublin Core (DC) Metadata Element Set, un insieme generico di 15 proprietà di metadati per la gestione di risorse testuali digitali. Seguendo gli standard degli schemi di metadati, le organizzazioni possono facilmente condividere e scambiare contenuti tra loro o importare e integrare contenuti da fonti esterne. Se però non si intende condividere i propri dati in questo modo, non è necessario seguire uno standard di metadati pubblicato.

Leggi anche:  Large Language Models - 3 strategie organizzative per utilizzarli in modo efficace

Gli standard seguiti per le tassonomie sono di due tipi diversi. Il primo è costituito dalle migliori pratiche di progettazione delle tassonomie, che si basano sulle linee guida per la creazione di tesauri pubblicate in ISO 25964-1 e ANSI/NISO Z39.19. Il secondo comprende gli standard di interoperabilità delle tassonomie, che sono SKOS e il suo modello di dati sottostante RDF. Gli standard ISO e ANSI/NISO forniscono indicazioni sulla formulazione dei termini e sulla strutturazione delle relazioni tra i termini, tra cui il formato di visualizzazione della tassonomia. SKOS (Simple Knowledge Organization System) e RDF (Resource Description Framework) sono modelli di dati pubblicati dal World Wide Web Consortium (W3C) per supportare i dati collegati e l’interoperabilità dei sistemi di organizzazione della conoscenza (tassonomie di vocabolari controllati, thesaurus, e altro) sul web. In quanto tale, SKOS è più simile a uno standard di metadati. Indipendentemente dal fatto che uno schema di metadati provenga o meno da uno standard pubblicato o sia sviluppato internamente, dovrebbe includere regole, definizioni ed esempi. Le proprietà dei metadati con vocabolari controllati per i loro valori necessitano inoltre di policy per l’aggiornamento dei vocabolari controllati e di chi ha l’autorità di prendere tali decisioni.


Heather Hedden

Esperta di tassonomia di fama mondiale, ha operato in vari ruoli per oltre 25 anni in numerose organizzazioni e come consulente indipendente. Attualmente, lavora per il team di servizi professionali di Semantic Web Company (fornitore del software PoolParty Semantic Suite). In precedenza, è stata editor senior di vocabolario per un editore didattico, tassonomista di uno sviluppatore software per motori di ricerca aziendali, e insegnante alla Simmons University School of Library and Information Science. Ha progettato e sviluppato tassonomie, thesaurus, ontologie e schemi di metadati per contenuti pubblicati internamente ed esternamente, compresi siti web, intranet e sistemi di gestione dei contenuti. Ha tenuto seminari sulla creazione di tassonomie in numerose conferenze e nell’ambito della formazione aziendale. È autrice del libro “The Accidental Taxonomist”, giunto alla seconda edizione.

Leggi anche:  Chatbot intelligenti in Java, come liberare il pieno potenziale dell’AI generativa

Heather Hedden presenterà per Technology Transfer il seminario “Taxonomy and Metadata Design” che si terrà online live streaming l’11 e 12 dicembre 2023.