Un ambiente collaborativo e self-service per un’analisi, visualizzazione e modellazione sicure dei dati consente una maggiore cooperazione tra data scientist, analisti e team commerciali
Cloudera ha presentato durante l’evento Strata+Hadoop World di San Jose Cloudera Data Science Workbench, un nuovo strumento self-service (attualmente disponibile in beta) per la data science basato su Cloudera Enterprise. Nato a seguito dell’acquisizione della startup di data science Sense.io dello scorso anno, Data Science Workbench permette ai data scientist di utilizzare librerie e linguaggi open source preferiti – tra cui R, Python e Scala – su una piattaforma enterprise sicura con integrazione nativa di Apache Spark e Apache Hadoop, per accelerare i progetti di analisi, dall’esplorazione alla produzione.
“Cloudera è focalizzata sul miglioramento della user experience dei team di data science e di progettazione, in particolare coloro che vogliono scalare le proprie analisi utilizzando Spark per l’elaborazione dei dati e il machine learning”, ha dichiarato Charles Zedlewski senior vice president Products di Cloudera. “L’acquisizione di Sense.io e del suo gruppo di lavoro ha fornito una solida base, e Data Science Workbench oggi consente un utilizzo più immediato da parte dei nostri clienti data science self-service”.
I vantaggi di Cloudera Data Science Workbench:
Per i data scientist
- Utilizzo di R, Python o Scala con le librerie e i framework preferiti, direttamente da un browser web.
- Accesso diretto ai dati in cluster Hadoop sicuri con Spark e Impala.
- Condivisione di approfondimenti con l’intero team per una ricerca riproducibile e collaborativa.
Per i professionisti IT
- Libertà per i team di data science di lavorare nelle modalità e nei tempi che preferiscono.
- Conformità costante con il supporto immediato per la piena sicurezza Hadoop, in particolare Kerberos.
- Operatività on-premise o in cloud, ovunque si gestiscano i dati.
L’approccio open data science va oltre i vasti ecosistemi Python e R per includere framework di deep learning come Tensorflow, Microsoft Cognitive Toolkit, MXnet, BigDL, e altro ancora, per questo i team di data science sono alla ricerca di modalità per utilizzare questi strumenti con i propri dati, che sempre più vengono memorizzati in ambienti Hadoop. Cloudera Data Science Workbench fornisce un ambiente sicuro e protetto per armonizzare le ultime innovazioni in ambito open source con la piattaforma unificata che gode della fiducia dei clienti di Cloudera.
“Fornendo un accesso immediato ai dati, Cloudera Data Science Workbench riduce il time to value delle applicazioni di intelligenza artificiale fornite con la piattaforma di machine learning automatizzata DataRobot”, ha dichiarato Jeremy Achin, CEO di DataRobot e co-fondatore. “DataRobot è completamente integrata e permette agli utenti di Cloudera di aumentare il valore di business grazie agli algoritmi e alle tecniche di data science migliori attraverso un’interfaccia semplice da utilizzare”.
“Spesso i gruppi IT dei nostri clienti riscontrano delle difficoltà nel portare in squadra i data scientist all’interno di ambienti condivisi, perché i loro bisogni sono profondamente diversi, soprattutto laddove sono coinvolti gli strumenti open source. Ciò solitamente porta a duplicazione, silos analitici, sicurezza e governance limitate. Allo stesso tempo, i data scientist cercano costantemente di scalare il loro lavoro verso set di dati più estesi e piattaforme di calcolo più potenti”, ha continuato Zedlewski. “Data Science Workbench Cloudera aiuta i gruppi IT e i data scientist a collaborare, portando più utenti verso ambienti condivisi in un modo che offre flessibilità e conformità”.