Software

Cloudera Enterprise 5.7 migliora prestazioni ed efficienza operativa per tutti i carichi di lavoro

22 Aprile 2016

Cloudera Enterprise 5.7 migliora l’elaborazione dei dati con il supporto di Hive-on-Spark e fornisce visibilità sull’utilizzo multi-tenant

Cloudera annuncia la disponibilità di Cloudera Enterprise 5.7. Questa nuova release offre prestazioni avanzate per i carichi di lavoro più importanti – tra cui un miglioramento medio di tre volte superiore per l’elaborazione dei dati con il supporto aggiuntivo di Hive-on-Spark, e un miglioramento medio di due volte superiore per le analisi di business intelligence con aggiornamenti per Apache Impala (in fase di progettazione). Inoltre, questa versione aggiunge visibilità sull’utilizzo multi-tenant di questi carichi di lavoro per una gestione efficiente e l’ottimizzazione delle risorse. Cloudera Enterprise 5.7 rappresenta un ulteriore significativo progresso per Hadoop e la sua crescita al fine di supportare nuovi e svariati casi d’uso, ed è rappresentativo della leadership di Cloudera nel garantire alle imprese moderne un utilizzo completo della piattaforma all’interno dell’intera struttura aziendale.

“Nel corso degli ultimi dieci anni, Hadoop si è evoluto in modo significativo e, a seguito di ogni progresso, intravvediamo il potenziale per nuove applicazioni e casi d’uso, migliorando al contempo ciò che è già stato fatto”, ha dichiarato Charles Zedlewski, vice president, Products di Cloudera. “L’avanzamento della progettazione dei dati e lo sviluppo ETL con Hive-on-Spark segna una tappa fondamentale di questa evoluzione – rafforzando ulteriormente il posizionamento di Spark quale motore standard per l’elaborazione dei dati in Hadoop. Tuttavia, l’engineering dei dati è solo una parte della storia nel mondo business di oggi e, con il rilascio 5.7, i nostri clienti possono abilitare un’ampia gamma di utenti alla piattaforma, il tutto mantenendo prestazioni veloci, facilità di gestione e compliance per la sicurezza”.

Lo sviluppo ETL e l’elaborazione in batch rimangono tra i casi di utilizzo più comuni per Hadoop. Apache Hive svolge da tempo un ruolo chiave per i carichi di lavoro, anche se tradizionalmente sfrutta MapReduce come motore di esecuzione. Tuttavia, grazie alle sue caratteristiche di facile sviluppo e prestazioni più veloci rispetto a MapReduce, Apache Spark assume un ruolo sempre più importante ed è candidato a sostituire MapReduce per i carichi di lavoro. L’anno scorso Cloudera ha lanciato One Platform Initiative come roadmap per completare il processo di transizione da MapReduce a Spark e per stimolare lo sviluppo di una migliore integrazione con Hadoop Spark, assicurando la soddisfazione dei requisiti aziendali per i carichi di lavoro di produzione anche su larga scala. Il rilascio di Hive-on-Spark in Cloudera 5.7 porta Spark più vicino agli sviluppatori che possono ora sfruttare le potenti capacità di elaborazione dei dati di Spark, pur continuando a utilizzare Hive, con prestazioni triplicate. Hive-on-Spark è un’iniziativa basata sulla community lanciata da Cloudera, IBM, Intel, MapR e altri, che coinvolge i clienti di molti settori – tra cui pubblicità, servizi finanziari e assicurazioni – come parte di un programma di accesso privilegiato per favorire un ulteriore sviluppo.

Per ulteriore coerenza, Cloudera ha lavorato con un ecosistema di oltre 2.300 partner per garantire ai clienti la possibilità di continuare a utilizzare gli strumenti principali per l’integrazione dei dati e di preparazione con Hive-on-Spark, senza interrompere l’attività aziendale. Partner tra cui BMC, ClearStory Data, Elastic, NGDATA, Solix, Trillium Software, Zementis e altri stanno collaborando con Cloudera per certificare le loro tecnologie per una transizione ottimale.

Essere in grado di supportare molteplici casi d’uso attraverso gli stessi dati condivisi all’interno di un singolo cluster è un vantaggio fondamentale per Hadoop. Con Cloudera Enterprise, gli amministratori possono facilmente fornire agli utenti e alle applicazioni le risorse corrette da utilizzare per soddisfare gli accordi Service Level Agreements (SLAs) più critici. Con quest’ultima release, gli amministratori ottengono piena visibilità sull’utilizzo passato e sull’efficienza per utenti, tenant e applicazioni. La nuova funzionalità di reporting di utilizzo del cluster, incorporata in Cloudera Manager, garantisce operazioni efficienti e la corretta allocazione delle risorse tra gruppi e tipologie di carico di lavoro; questo aiuta a soddisfare gli accordi SLA e fornisce una semplice risoluzione delle problematiche legate alle prestazioni di lavoro e alle query.

Di seguito, alcune delle altre caratteristiche di Cloudera 5.7:

Raddoppio delle prestazioni per le analisi di BI: Impala continua a mantenere la sua leadership in termini di prestazioni come il più veloce motore analitico SQL per Hadoop attraverso il partizionamento dinamico, un più veloce avvio delle query, filtri di runtime e altro ancora
Percorso semplificato per la produzione: Cloudera Manager include modelli di cluster che forniscono un semplice flusso di lavoro per replicare facilmente le impostazioni di configurazione di nuovi cluster – che lo rende facile da dislocare da un ambiente di test ottimizzato alla produzione, scalare tra le diverse aree geografiche o ripristinarlo rapidamente a una configurazione conosciuta in caso di problemi
Governance dei dati ottimizzata: Cloudera Navigator si apre alla gestione dei dati e alla governance per l’utente business con funzionalità di derivazione semplificate per stabilire l’affidabilità e la provenienza dei dati, e aggiunge metadati gestiti per migliorare la reperibilità e la coerenza tra i sistemi.

Cloudera Enterprise 5.7 migliora prestazioni ed efficienza operativa per tutti i carichi di lavoro

TI PIACE QUESTO ARTICOLO?

TOP 100 DELL'ICT SOSTENIBILE

WEB COVER

CSI Lifecycle Services, l’equilibrio tra innovazione e sostenibilità

NovaNext, l’innovazione che connette il futuro