Le tecnologie per la gestione e la condivisione dei dati sono in continua evoluzione e permettono di sviluppare soluzioni di machine learning e di analisi dei dati in tempi brevi e con una notevole riduzione dei costi
Cloudera ha lanciato Cloudera SDX, un software framework modulare che permette alle aziende di vivere un’esperienza dati condivisa, una shared data experience. Grazie a un ambiente di lavoro centralizzato, sicuro, che rispetti i requisiti aziendali e che permetta un’analisi dei dati approfondita, SDX consente a numerose applicazioni di eseguire insiemi di dati condivisi o sovrapposti. SDX, già disponibile per i clienti Cloudera Enterprise, rende le applicazioni dati multifunzione più facili da sviluppare, meno costose da implementare e sempre più sicure.
Affrontare sfide aziendali come la cybersecurity, i prodotti e i servizi connessi e la soddisfazione del cliente, richiede la collaborazione di diverse applicazioni complesse. Per esempio, l’Internet of things (IoT) spesso coinvolge l’analisi ad hoc e l’apprendimento automatico su batch e streaming di dati. Le piattaforme Next-best-offer utilizzano il machine learning e l’elaborazione in tempo reale. In molti casi questi cluster di applicazioni multifunzione vengono eseguiti su un’infrastruttura cloud o si basano su dati generati direttamente in cloud.
Lo sviluppo e la distribuzione di queste applicazioni complesse è una sfida in cluster multi-tenant on-premise, e risulta particolarmente difficile in ambienti cloud perché il contesto e le policy dei dati non sono le stesse in ambienti transitori. Inoltre, la maggior parte dei servizi cloud sono in realtà applicazioni in esecuzione all’interno di cluster isolati.
SDX consente ai clienti di creare, gestire e proteggere queste applicazioni analitiche multifunzione ad alto valore aggiunto e agevola le soluzioni partner certificate Cloudera che si integrano con le funzionalità della piattaforma.
Un componente chiave all’interno di Cloudera SDX è un catalogo dati condiviso su cui possono essere stabilite e sfruttate funzioni di sicurezza, governance e gestione sia per le applicazioni analitiche di lunga durata sia per quelle transitorie. Il catalogo condiviso, inoltre, consente anche l’accesso self-service ai dati aziendali, evitando al dipartimento IT di dover effettuare ulteriori controlli.
“Le aziende spesso citano la sicurezza, la governance e la complessità tra le ragioni principali per cui non spostano i carichi di lavoro operativi nel cloud”, ha dichiarato Tony Baer, principale analista di Ovum. “Cloudera ha preparato il terreno, costruendo le funzionalità di sicurezza e governance dei dati per agevolare le imprese ad affrontare questo passaggio affinché siano sicure e in grado di sostenere i carichi di lavoro dei big data nell’ambiente di produzione. Cloudera SDX, infatti, si basa sull’IP dell’azienda e offre un’esperienza di dati condivisa tra ambienti cloud e locali”.
Ecco le sfide più critiche per le aziende che Cloudera SDX risolve:
- Data silos – I cluster self-service nel cloud non condividono in modo naturale dati e metadati, quindi i singoli cluster diventano silos de facto. Condividendo dati e metadati persistenti tra le applicazioni on-demand e i cluster transitori, è possibile evitare singoli controlli senza aggiungere costi di duplicazione e archiviazione dei dati.
- Violazioni di sicurezza – Senza controlli di sicurezza centralizzati, gli amministratori sono costretti ad applicare continuamente policy di sicurezza e di accesso contro molteplici copie di dati all’interno di silos, creando lavoro aggiuntivo e aumentando il rischio di esporre informazioni sensibili. Con Cloudera SDX la sicurezza viene applicata in modo coerente al livello dei dati. Le politiche sono pervasive e non devono necessariamente cambiare o essere applicate di nuovo quando i dati vengono spostati o utilizzati all’interno di una nuova applicazione.
- Sfide di governance e conformità – Un catalogo condiviso di dati e metadati è indispensabile per affrontare oggi la conformità HIPAA e PCI-DSS e requisiti incombenti come il GDPR. Un catalogo dati condiviso facilita la ricerca e la comprensione rapida del contesto dei dati, consentendo applicazioni self-service e fornendo funzionalità inviolabili di audit e lignaggio.
Di seguito le funzionalità, disponibili da ottobre all’interno di Cloudera 5.13, che qualificano maggiormente le capacità di SDX per gli ambienti cloud:
- Catalogo multi-cluster, un metastore Hive basato su Amazon RDS condiviso o MySQL condiviso per gli utenti Azure, per memorizzare e gestire il contesto circa i dati.
- Funzionalità multi-cluster di Cloudera Navigator semplificano agli utenti la ricerca dei dati e la gestione dell’accesso, il rispetto dei requisiti e dell’origine dei dati.
- Autorizzazioni di sicurezza Sentry multi-cluster e soluzioni per fornire controlli di accesso granulari e basati sui ruoli di accesso.
- L’interfaccia Cloudera Manager è presente su ogni cluster per una più semplice autenticazione dei dati.
- Backup e disaster recovery da cluster on-premise ad Amazon S3.
“SDX rappresenta ‘l’ingrediente segreto’ all’interno di Cloudera Enterprise che consente di accelerare la data science, l’apprendimento automatico e le analisi”, ha dichiarato Mike Olson, fondatore e CSO di Cloudera. “I dati sono la risorsa più preziosa al mondo: sono il carburante delle analisi, potenziano le macchine e sono in grado di risolvere problemi fino a oggi impossibili. Da sempre, infatti, l’attenzione di Cloudera è rivolta al supporto per le aziende nel creare valore a partire dai dati, e Cloudera SDX semplifica questa missione sia per gli utenti IT sia per quelli business”.
Le voci dei clienti e dei partner
“SDX fornisce una serie impressionante di funzionalità necessarie per implementare e gestire con successo una piattaforma analitica moderna”, ha dichiarato Wei Zheng, vice presidente, Products di Trifacta. “Poiché i nostri clienti utilizzano Trifacta per indirizzare dei dati grezzi in output puliti al fine di eseguire analisi e avviare l’apprendimento automatico, essi generano una grande quantità di metadati incredibilmente preziosi per supportare gli sforzi relativi alla governance di un’organizzazione. Siamo entusiasti, infatti, di come l’integrazione di Trifacta con SDX consentirà ai clienti comuni di gestire i metadati in modo più efficace e di renderli disponibili ai vari stakeholder per rispondere alle loro sfide in ambito sicurezza e governance”.
“SDX è un’altra importante innovazione che crea più valore ai clienti comuni fornendo servizi condivisi e semplificando la sicurezza e la governance dei dati aziendali”, ha dichiarato Girish Pancha, CEO di StreamSets, la piattaforma premiata per l’analisi dati sia in lettura che in scrittura dei metadati business e tecnici. “I clienti possono contribuire a scomporre i silos di dati e fornire agli utenti finali degli SLA migliori con l’obiettivo di renderli più efficaci ed efficienti nell’analisi dei dati all’interno di Cloudera”.
“Grazie alla piattaforma Cloudera, il nostro strumento dedicato alla biosorveglianza della sepsi ne consente la rilevazione in modo più rapido e aiuta a ridurre sensibilmente i tassi di mortalità”, ha dichiarato il Dr. Joseph Colorafi, Vice Presidente System, Chief Medical Information Officer di Dignity Health. “Cloudera SDX ci consente di applicare regole di governance e sicurezza, compresa la crittografia in rest e in motion, l’autorizzazione, l’autenticazione e l’intera serie di requisiti di conformità alle norme HIPAA”.
Cloudera SDX supporta molteplici configurazioni sia in cloud pubblici sia in cloud privati ed è oggi disponibile per i clienti che possiedono le licenze Cloudera Data Science e Engineering, Analytic DB, Operational DB o Enterprise Data Hub.