È ormai chiaro che un approccio data driven al governo del business rappresenta un valore per l’impresa. La disponibilità di informazioni adeguate sostiene l’organizzazione nell’operatività, nella gestione strategica, nella compliance alle normative, nella competizione sui mercati. C’è invece a mio avviso meno consapevolezza su come le tecnologie dell’informazione possano concretamente sostenere questo principio non più nuovo, ma ancora non completamente soddisfatto dall’offerta IT.
Ne è un esempio una survey di Forbes che stima in circa il 79% l’impegno che un data scientist dedica a operazioni “poco sexy” rispetto all’idea romantica di questo ruolo: raccolta, pulizia, organizzazione dei dati da impiegare nelle proprie analisi. Attività che chiamano in causa un’altra figura, quella del data engineer. Sono due competenze spesso distinte, anche per ragioni organizzative, che però non possono non operare in sinergia. Il data scientist indica il contesto su cui intende condurre le sue indagini, esprimendone le caratteristiche in termini di requisiti; il data engineer organizza un modello dati rispondente ai requisiti, esplora le fonti informative disponibili, verifica la presenza e la qualità dei dati necessari, cura l’alimentazione. Si opera in stretta interazione, con calibrazioni e iterazioni successive non solo dei modelli di analisi, ma anche del modello dati sottostante.
Spesso il modello evolve durante l’analisi. E dall’analisi delle fonti può emergere la presenza di dati non immediatamente utili, ma in grado di suggerire al data scientist nuovi interessanti percorsi di indagine. Una chiara comprensione del contesto di analisi e una sua fedele rappresentazione nel modello dati sono fondamentali: ma la comprensione e il contesto stesso possono maturare ed evolvere nel tempo, ed è necessario che anche il modello dati sia dinamico, agile. Inoltre, in queste situazioni l’espressione “profonda” dell’obiettivo deve essere disaccoppiata dagli algoritmi per ottenerlo: è la base del paradigma Declarative, applicabile a tutta una serie di ambiti data intensive (reporting, compliance, controllo di processi…): non pensare a come fare, ma a cosa vuoi ottenere.
La sfida per i vendor IT è quella di realizzare, resistendo alla tentazione di interventi di make-up del proprio catalogo e dei propri prodotti, una nuova classe di soluzioni enterprise data management (EDM): uno strumento pensato per il Declarative EDM deve liberare il team dalla complessità del “come”, favorendo l’espressione del “cosa” e automatizzando tutti i passaggi tecnici che non sono a valore aggiunto. Non è un’utopia, il linguaggio SQL è forse il più noto esempio di “dichiarativo”. Ovviamente, i vantaggi per un’organizzazione data driven prodotti da queste nuove tecnologie sono tanto più evidenti quanto più essa saprà dotarsi di standard di data management e governare il proprio patrimonio informativo. È su queste basi che trova piena concretezza il concetto di EDM.
Alberto Scavino CEO di Irion