Le tendenze e le best practices 2019 del Data Warehouse in cloud

Sempre più aziende scelgono di spostare i carichi di lavoro avanzati sul Cloud

Lo studio condotto da TDWI per conto di Talend evidenzia come ottimizzare il ritorno degli investimenti del data warehouse in cloud

La nuova indagine condotta da TDWI per conto di Talend i nuovi data warehouse in cloud (CDW) offrono una capacità di dati più ampia, prestazioni più elevate e una maggiore flessibilità rispetto ai tradizionali database on-premise. Dall’indagine è emerso che, sebbene i CDW siano spesso un primo passo importante verso la trasformazione digitale, le imprese devono seguire alcune prassi per affrontare le nuove sfide e per aumentare il ritorno degli investimenti.

TI PIACE QUESTO ARTICOLO?

Iscriviti alla nostra newsletter per essere sempre aggiornato.

“L’indagine TDWI considera un’ampia gamma di sistemi IT basati sui dati che migrano in modo consistente verso il cloud includendo il data warehouse”, ha dichiarato Philip Russom, Senior Research Director, Data Management di TDWI. “Il cloud fornisce al data warehouse scalabilità elastica, archiviazione agnostica, accesso multi-tenant e controllo dei costi che è fondamentale per soddisfare le nuove esigenze.Tuttavia, i data warehouse in cloud dovrebbero essere completati con una sostanziale infrastruttura di integrazione dati per unificare le diverse parti del warehouse con tutte le fonti di dati e in base agli obiettivi”.

Decision Resources Group (DRG) rappresenta un esempio. In quanto azienda che gestisce l’archiviazione completa dei dati di oltre il 90% del sistema sanitario statunitense, DRG ha dovuto affrontare le sfide di dover gestire una varietà di fonti diverse di dati. I dati sanitari sono archiviati in modo strutturato, con la necessità quindi da parte di DRG di pulire e normalizzare milioni di record e gruppi di dati in modo da valutare le esigenze dei pazienti e le condizioni di mercato. DRG è riuscita con successo a passare ad una strategia cloud-first implementando la soluzione Talend e il data warehouse in cloud Snowflake, come base fondamentale della sua nuova piattaforma Real World Data. Grazie a questa implementazione, la produttività di DRG è cresciuta del 150% senza aumentare i costi e in soli tre mesi, ha integrato 100 terabyte di dati. L’azienda può ora fornire dati più significativi che consentono ai medici di gestire le diverse categorie di pazienti e i fornitori possono interagire in modo più ottimizzato.

Leggi anche:  I benefici economici del Cloud Adjacent Storage

I partecipanti al sondaggio oltre ad aver verificato che l’adozione dei CDW è stata fondamentale nell’ottenere prestazioni più rapide a costi inferiori e a sfruttare le funzionalità del cloud, hanno osservato anche una serie di sfide correlate al CDW. Oltre il 50% degli intervistati ha indicato la “governance dei dati” come una delle sfide principali, il 40% ha indicato “l’integrazione dei dati attraverso fonti multiple” e circa il 38% “l’inserimento dei dati nel warehouse”. Le esigenze da parte delle aziende di analisi dei dati in un CDW stanno diventando sempre più articolate. Oltre il 35% degli intervistati ha espresso la necessità di avere l’elaborazione in memoria, il supporto per dati strutturati e non strutturati e l’integrazione di tool per le analisi di terze parti. Di conseguenza, i CDW devono accogliere un’ampia varietà di dati e servire una ampia gamma di casi d’uso.

È interessante notare che per il 62% degli intervistati nel processo di implementazione dei CDW desidera che sia integrato un data lake per le analisi. Tutti gli intervistati sono interessati a funzionalità quali la qualità dei dati, la gestione dei metadati, l’elaborazione e la trasformazione dei dati, sia prima sia dopo il caricamento degli stessi in un CDW.  Poiché questi requisiti non possono essere soddisfatti solo dalle tecnologie CDW, come responso viene suggerita la necessità di adottare delle soluzioni di integrazione dati per completare l’infrastruttura. I CDW devono essere in grado di soddisfare una vasta gamma di casi d’uso, da quello commerciale a quello tecnico e di supportare gli incrementi in velocità e in scala, gestendo al tempo stesso le esigenze attuali e future.

Leggi anche:  OVHcloud amplia la propria strategia SecNumCloud con la certificazione SecNumCloud 3.2 in tre data center differenti

“I data warehouse cloud consentono alle aziende di creare applicazioni di casi di utilizzo basate sui dati e di distribuire dinamicamente i cluster di dati. Tuttavia, per avere successo, le imprese devono comprendere le esigenze dell’intera organizzazione”, ha dichiarato Ashley Stirrup, chief marketing officer di Talend. “La maggior parte delle aziende che utilizzano CDW si aspettano di essere in grado di inserire i dati e il resto seguirà. Al fine di realizzare tutti i benefici – al di là della semplice riduzione dei costi – i data architect devono essere consapevoli di come ogni business unit utilizzi i dati avendo come focus l’integrazione”.

Quando si adotta un CDW, occorre tenere presente le esigenze di architettura e integrazione dei dati. A differenza di alcune soluzioni, l’integrazione di Talend aiuta ad ottimizzare e scalare l’elaborazione dei dati prima e dopo la loro collocazione in un CDW in modo da ottenere trasformazioni complesse e avanzate.