EMC e il Big Data: 15 PB in un unico filesystem grazie a Isilon

cloudera big data

La ricerca in dati non strutturati è sempre stato un problema. Ma quando i dati non strutturati crescono in modo quasi esponenziale, anche il problema cresce nello stesso modo. E se i dati risiedono su supporti magnetici e sono organizzati in filesystem è da lì che bisogna incominciare

Ad aprire la mattinata EMC dedicata al Big Data è stato Roberto Sortino, Mid Tier Business Director, il quale ha fatto una panoramica esaustiva della situazione e ha presentato la soluzione proposta. Il tema del Big Data ha sostanzialmente due sfaccettature: la quantità dei dati e il valore dei dati.

TI PIACE QUESTO ARTICOLO?

Iscriviti alla nostra newsletter per essere sempre aggiornato.

I Big Data

Quando si parla di Big Data, per il relatore, in sostanza si fa riferimento a dati non strutturati in database che contengono informazioni importanti per l’azienda. Questi dati crescono esponenzialmente senza alcuna struttura e parallelamente si assiste a un progressivo passaggio di questi verso il cloud.

E’ importante quindi avere sempre maggior spazio su un unico filesystem e una sempre maggior velocità di accesso; anche i dischi a 15000 giri possono essere lenti e nonostante l’evoluzione degli SSD, la capacità di questi è ancora contenuta, se paragonata a quella dei dischi tradizionali, e i costi sono elevati. Ma, d’altra parte, tutte le industrie stanno vivendo questa trasformazione.

Ma a cosa servono alle aziende i dati in tali quantità?

In massima sintesi: customer intimacy (45%), budget & planning (39%), operations & supply chain (37%), customer service (33%), performance management (30%), new product strategy (28%) e pricing (21%).

La soluzione è quella di avere un’architettura scalabile la cui dimensione possa essere misurata in termini di petabyte. Isilon parte da una settantina di terabyte, nella sua configurazione base, e può crescere fino a 15 PB in un singolo file system. Ma anche questo non basta, bisogna posizionare il dato nel punto più opportuno, ovvero disporre di algoritmi in grado di mantenere i dati maggiormente acceduti sui supporti magnetici a maggior velocità di accesso.

Leggi anche:  Chatbot intelligenti in Java, come liberare il pieno potenziale dell’AI generativa

EMC Isilon

Isilon è integrato con l’architettura VMware e garantisce uno SPECsfs2008 CIFS Performance di 1.6 Million Cifs Iops, il massimo con un 126% in più rispetto al secondo posizionato.

Altro significativo vantaggio è il fatto che l’aumento dei nodi induce a un ribilanciamento della macchina (si monta un nodo in 60 secondi con ribilanciamento automatico).

Un ulteriore elemento che spinge a pensare a soluzioni di questo tipo è che con queste moli di dati risulta molto difficile, se non impossibile, pensare di poter fare backup, almeno con la dovuta frequenza; occorre quindi poter far conto su un’architettura autoconsistente.

Sulla base di un IDC Business Value Strategy Analysis del 28 Novembre 2011, Isilon incrementa la produttività dell’IT del 48% e riduce l’OPEX.

A fronte di tutto questo non sorprende il fatto, ha concluso il relatore, che secondo l’Hardwar Business Review dell’ottobre di quest’anno la professione del così detto Data Scientist sarà “the Sexties Job of the 21st Century”. Si tratta, come il termine stesso lascia intendere, di una figura professionale il cui compito sarà quello di analizzare i dati per crearne “immagini diverse”.

E’ stato quindi il momento di un’interessante case history. L’esperienza di DeejayTV nel settore Broadcasting e Video è stata raccontata da Roberto Brasca, DeejayTV All Music – ReteA basandosi su una presentazione a cura di Andrea Reposo, in cui è apparso evidente il ruolo fondamentale in quel settore di un’architettura di questo tipo.

A illustrare invece in maggior dettaglio il prodotto è stato Gianluca Binda, Isilon Regional Territory Manager, EMC.