Viaggio verso il data warehouse logico. Il grande dilemma della business intelligence

Viaggio verso il data warehouse logico

Qual è la data di scadenza dell’architettura tradizionale del data warehouse? Ecco come sviluppare un’architettura bi-modale di data warehouse logico basata sulla virtualizzazione dei dati

Ogni tecnologia, ogni architettura e ogni tecnica di progettazione ha una data di scadenza. E questo è vero soprattutto per il mondo dell’IT. Sarebbe inconcepibile che i linguaggi assembler, i database gerarchici e le tecniche di progettazione a cascata fossero ancora utilizzati per sviluppare i complessi sistemi di oggi. E la business intelligence non fa eccezione: il cuore dei più attuali sistemi di BI è costituito da un’architettura tradizionale di data warehouse, inizialmente progettata per supportare forme classiche di reporting. Per tali sistemi, aspetti come una migliore governance, l’alta qualità dei dati e la stabilità giocano un ruolo chiave. Per offrire queste caratteristiche, i sistemi di BI sono accompagnati da processi rigidi di sviluppo, operatività e gestione. L’architettura tradizionale del data warehouse ha avuto una lunga carriera di oltre venticinque anni, nei quali ha servito al meglio innumerevoli aziende, ma per molte di queste ha ormai superato la data di scadenza. Data l’architettura rigida, molti nuovi requisiti di BI sono difficili da implementare con i sistemi di BI esistenti. Per esempio, i sistemi di BI devono supportare nuove forme di reporting e di analisi, come la BI self-service, le analisi investigative, la data science, gli utenti esterni come clienti online, partner e fornitori, le nuove tecnologie di memorizzazione come Hadoop e NoSQL, le fonti di dati esterne, come i dati sui social media e gli open data, e infine le grandi quantità di dati. Inoltre, è necessario accelerare il time to market per i report.

TI PIACE QUESTO ARTICOLO?

Iscriviti alla nostra newsletter per essere sempre aggiornato.

Le aziende sanno che il loro attuale sistema di BI non può essere buttato via, perché i carichi di lavoro di reporting esistenti devono continuare a funzionare. Ma come dovrebbero implementare questi nuovi carichi di lavoro di BI e integrarli in qualche modo con il sistema esistente? Molte aziende lottano con questo dilemma, cercando di risolvere il problema sviluppando molte isole analitiche e, dato che poche specifiche sono condivise da un’isola all’altra, i business analyst si trovano a dover sempre reinventare la ruota. Inoltre, è quasi impossibile garantire una coerenza tra i report classici e i nuovi carichi di lavoro della BI. In che modo le vecchie e nuove forme di BI possono essere supportate dallo stesso sistema? È il grande dilemma della BI che va risolto. Sono necessarie nuove architetture di BI che supportino lo stile tradizionale e un po’ rigido dello sviluppo della BI con il nuovo stile di sviluppo introdotto dai nuovi requisiti di BI.

Leggi anche:  I cinque principi chiave della sostenibilità data-driven

Scarica gratuitamente il White Paper

Perché la virtualizzazione dei dati è la migliore tecnologia per sviluppare data warehouse logici bimodali


 

Le architetture bi-modali

Nel 2014, Gartner ha introdotto il concetto di bi-modale. Il termine “bi-modale” si riferisce a due modalità di sviluppo IT. La Modalità 1 è lo stile classico di sviluppo, in cui ogni sistema deve essere affidabile, prevedibile e corretto. I sistemi devono essere testati, governati e gestiti formalmente, devono essere verificabili e così via, mentre la Modalità 2 corrisponde agli stili di sviluppo più agili che si concentrano sulla velocità e sull’agilità, oltre a supportare la sperimentazione, la flessibilità e l’analisi self-service. Secondo i dati di un’indagine di Gartner del 2014, il 45% dei CIO diceva di operare in Modalità 2, con la previsione che entro il 2017 il 75% di tutte le organizzazioni IT avrebbero operato in maniera bi-modale, supportando cioè entrambe le modalità. Le specifiche Modalità 1 e Modalità 2 corrispondono rispettivamente allo sviluppo di report classici e allo stile di sviluppo utilizzato dalle nuove forme di business intelligence. In BI, i report classici (Modalità 1) devono essere affidabili, prevedibili, testati, governati, riproducibili, e così via, mentre le nuove forme di BI (Modalità 2) sono più sperimentali, flessibili e orientate al self-service. La sfida, per la maggior parte delle aziende, è come trasformare il loro attuale sistema di BI in un moderno sistema di BI che supporti entrambe le modalità di sviluppo. In altre parole, devono trasformare il loro sistema di BI unidirezionale in uno bi-modale.

L’architettura di data warehouse logico

Una nuova architettura adatta allo sviluppo di sistemi di BI bi-modali è l’architettura di data warehouse logico. È un’architettura agile per lo sviluppo di sistemi di BI in cui i consumatori dei dati e gli archivi dei dati sono disaccoppiati gli uni dagli altri. L’architettura di data warehouse logico presenta tutti i dati memorizzati in un insieme eterogeneo di archivi dati come un singolo database logico. I consumatori di dati non devono essere consapevoli di dove e come sono archiviati i dati. E non devono preoccuparsi neppure se i dati che stanno utilizzando provengono da un data mart, da un data warehouse o da un database di produzione. Non devono essere consapevoli del fatto che i dati provenienti da più archivi di dati devono essere uniti, né devono sapere se stanno accedendo a un database SQL, a un cluster Hadoop, a un database NoSQL, a un servizio Web o semplicemente a uno o più file flat. Anche la struttura degli archivi dati è nascosta: i consumatori di dati vedono solo i dati in un modo che è comodo per loro e vedono solo i dati rilevanti per il loro compito. Tutto ciò è ottenuto disaccoppiando i consumatori di dati dagli archivi di dati. L’obiettivo principale del disaccoppiamento è ottenere un maggiore livello di flessibilità. Per esempio, le modifiche apportate agli archivi dati non significano automaticamente che anche i report devono essere modificati, e viceversa. Oppure, sostituire una tecnologia di data store con un’altra è più semplice quando quell’archivio dati è “nascosto” dietro l’architettura del data warehouse logico. In questa architettura, l’adozione di big data è relativamente semplice, l’accesso ai dati in tempo reale è meno complesso per i consumatori di dati, e gestire i dati basati su cloud diventa semplice.

Leggi anche:  Fujifilm, ripartenza sprint dopo il riassetto societario

I vantaggi della virtualizzazione dei dati

I sistemi di BI con questa architettura possono presentare la stessa robustezza del data warehouse tradizionale per le forme standard di reporting. Inoltre, sono più adatti a supportare nuove fonti di dati, come i big data e gli open data; possono gestire più facilmente nuove tecnologie di archiviazione dei dati, come Hadoop e NoSQL; si adattano meglio al dinamico mondo della BI self-service; semplificano il supporto per l’analisi investigativa e la data science; infine, accelerano lo sviluppo e facilitano la manutenzione con meno risorse. Diverse tecnologie consentono lo sviluppo di un sistema di BI basato su un’architettura di data warehouse logico, come i database server in-memory e la tecnologia di data grid. Tuttavia, la tecnologia di virtualizzazione dei dati offre la soluzione migliore, in quanto supporta quasi tutte le funzionalità necessarie per sviluppare, eseguire, proteggere e gestire un data warehouse logico. La virtualizzazione dei dati offre funzionalità per la sicurezza dei dati, scalabilità, prestazioni, sviluppo, riutilizzo dei metadati, individuazione e ricerca, accesso ai big data, etc. Ma soprattutto offre un livello di astrazione completo che disaccoppia i consumatori di dati dagli archivi di dati.

In conclusione

Il grande dilemma della BI è un vero problema per molte aziende. Sfortunatamente, non esiste uno strumento soprannaturale in grado di trasformare magicamente un sistema di BI esistente in un sistema di BI bi-modale. La soluzione deve essere trovata nella configurazione di sistemi di BI con un’architettura diversa. L’architettura del data warehouse logico è per definizione pronta per la modalità multimodale. Inoltre, la tecnologia di virtualizzazione dei dati ha raggiunto il livello di maturità necessario per sviluppare un’architettura di data warehouse logico. In altre parole, non ci sono ostacoli nel viaggio verso il data warehouse logico.

Leggi anche:  Codice KOSKO, guida pratica per costruire team di successo

Rick van der Lans

Analista indipendente, consulente, autore e speaker specializzato in data warehousing, BI, big data e tecnologia database. Aiuta i clienti a progettare i propri data warehouse e ad adottare soluzioni di business intelligence. Nel corso degli anni, ha scritto centinaia di articoli per giornali e siti web e ha creato molti white paper per numerosi vendor. Ha scritto il primo libro disponibile su SQL, dal titolo “Introduction to SQL”, che è stato tradotto in numerose lingue e ha venduto oltre 100mila copie. Più recentemente, ha pubblicato “Data Virtualization for Business Intelligence Systems” (Morgan Kaufmann, 2012).

Per Technology Transfer, Rick van der Lans presenterà a Roma nella prossima primavera i seminari: “Incorporare Big Data, Haddop e NoSQL nei sistemi di Data Warehouse e BI” il 15-16 aprile 2019 e “Il Logical Data Warehouse: Design, Architettura e Tecnologiail 16-17 maggio 2019.