Cloudera ha annunciato che presenterà una proposta affinché Impala e Kudu entrino a far parte dell’Apache Software Foundation (ASF).
Donando ad ASF i suoi principali progetti in ambito database analitico e storage colonnare, Cloudera desidera accelerare la crescita e la varietà delle rispettive comunità di sviluppatori.
Fin dal suo lancio nel 2012, Impala si è diffuso su larga scala ed è stato adottato come il principale database analitico per Hadoop, con supporto per molteplici vendor del settore e integrazioni con tutti i principali strumenti di business intelligence (BI). In primis Impala migliorava le prestazioni SQL interattive su Hadoop con funzionalità di base SQL-92, quindi Impala 2.0 ha sviluppato ulteriormente le sue funzionalità di analisi SQL, abilitando soluzioni di business intelligence operativa e data discovery a bassa latenza e supportando la concomitanza multi-utente tra analisti e utenti occasionali. Impala 2.0 ha segnato una svolta per molte aziende, fornendo tali casi d’uso aziendali e un accesso diffuso ad Hadoop.
La maggioranza dei clienti di Cloudera in tutti i settori oggi si affida ad Impala per i propri carichi di lavoro di analisi e BI enterprise, tra cui Epsilon, Magnify Analytic Solutions, Premier, Quaero, RelayHealth e SFR. Costantemente focalizzato sull’affidabilità su larga scala, Impala ha aiutato i clienti a eseguire milioni di query, operando su cluster da decine a centinaia di nodi e con oltre mille utenti contemporanei.
Impala è sempre stato fornito sotto licenza Apache sin dal suo lancio pubblico per poi affermarsi come standard open source all’interno dell’ecosistema Hadoop. Sin dall’inizio di quest’anno, quando Impala è stato aperto ai contributi della comunità, si è verificato un aumento dell’attività di sviluppo, con Google che ha sviluppato integrazioni tra Impala e BigTable, oltre a contributi da parte di Arcadia Data, Intel e altri. Donando il progetto ad ASF, questa comunità diversificata può ulteriormente indirizzare la visione di Impala per farla evolvere dalla sua base consolidata.
La recente release beta di Kudu, il nuovo motore di storage aggiornabile per Hadoop, rappresenta un’altra pietra miliare fondamentale per l’analisi su Hadoop. Per la prima volta, la comunità dispone di un motore di query interattivo con Impala e un motore di storage aggiornabile con Kudu per abilitare veloci casi d’uso d’analisi sui dati. In un breve periodo a partire dal suo rilascio, Kudu ha ricevuto un ampio interesse all’interno della comunità open source. Attraverso la sua domanda di adesione ad ASF, Kudu continuerà a trarre beneficio dalla più ampia comunità di sviluppo e la collaborazione di questi progetti amplierà in modo significativo i casi d’uso relativi mentre sempre più aziende cercano di sviluppare applicazioni analitiche in tempo reale.
“Crediamo che l’ASF sia il luogo giusto per promuovere una comunità open source dedicata allo sviluppo di Impala e Kudu. Prevediamo che questi progetti trarranno beneficio da una collaborazione più produttiva con i progetti Apache correlati e, sotto gli auspici dell’ASF, attireranno collaboratori di talento che stimoleranno lo sviluppo” ha affermato Doug Cutting, chief architect di Cloudera e co-creatore di Hadoop. “Con una solida base architetturale impostata per entrambi i progetti, riteniamo che sia il momento giusto affinché lo sviluppo passi in toto ad ASF”.
Cloudera continuerà a sviluppare e supportare attivamente i progetti Impala e Kudu, come ha fatto con una serie di progetti ASF di successo. I dipendenti di Cloudera hanno fondato e lanciato diversi progetti open source con l’ASF, tra cui Apache Hadoop, Apache Flume, Apache HBase, Apache Parquet e ZooKeeper. All’interno dell’Apache Software Foundation, Cloudera conta 13 suoi dipendenti membri di Apache, un titolo che detiene il merito più alto all’interno della fondazione. I membri sono: Sean Busbey, Jarek Jarcec Cecho, Doug Cutting, Patrick Hunt, Todd Lipcon, Mark Miller, Aaron T. Myers, Sean Owen, Yonik Seeley, Michael Stack, Tom White e Xuefu Zhang.
“Impala ha avuto un impatto significativo sull’ampia diffusione di Hadoop, è il suo ingresso in ASF è un segnale dell’elevata richiesta affinchè Hadoop sia accessibile a tutte le aziende”, ha affermato Marcel Kornacker, fondatore di Impala e lead architect di Cloudera. “Abbiamo creato una solida base per Impala e siamo entusiasti di continuare a delineare la sua visione con la comunità open source”.
“Siamo entusiasti dall’accoglienza da parte della comunità, sviluppatori open source e utenti, in molte aziende diverse, nei pochi mesi passati dal rilascio della beta di Kudu a settembre. L’esigenza di un motore di storage aggiornabile nell’ecosistema Hadoop ha ottenuto riscontro, in particolare dato il maggior interesse nella creazione di applicazioni analitiche in tempo reale”, ha affermato Todd Lipcon, fondatore e progettista capo del progetto Kudu in Cloudera. “A seguito della presentazione di Kudu all’incubatore Apache, lavoreremo con entusiasmo con la più ampia comunità di sviluppatori dell’ecosistema Hadoop per continuare a creare integrazioni Kudu con il resto dell’ecosistema e a sviluppare una nuova soluzione di storage a standard aperto”.