60 Gbit di dati vengono generati ogni secondo al di fuori dell’atmosfera terrestre. Big Blue li analizza con Apache Spark assieme alla NASA e Seti
Durante la conferenza Apache: Big Data Europe, Anjul Bhambrhi, vice presidente big data di IBM ha spiegato una metodologia utilizzata dalla sua azienda per indagare i misteri dello Spazio. Fulcro centrale dell’operato di IBM è il framework Apache Spark, perfetto per implementare processi in cui sono coinvolti algoritmi di machine learning. “Pensiamo che Spark sia perfetto dal punto di vista analitico – ha detto Bhambrhi – è pieno di funzioni e con possibilità di sviluppo praticamente infinite grazie all’open source”. Spark, secondo IBM, è un progetto chiave perché è in grado di unire la semplicità dell’utilizzo in un ambiente altamente performante, aperto ad integrazioni con terze parti che consentono di estenderne il campo applicativo.
Monitorare lo Spazio
Durante la conferenza, IBM ha rivelato di star utilizzando Spark per un progetto davvero curioso e lungimirante. Assieme alla NASA e a Seti, il gigante statunitense analizza i segnali radio alla ricerca di “intelligenze extra-terrestri”. Per farlo processa all’interno di Spark circa 60 Gbit di dati al secondo, catturati da ricevitori vari puntati al di là dell’atmosfera terrestre. La partnership tra i tre era partita a luglio, con l’intento di studiare le origini, la natura e la presenza di vita nell’universo. La NASA ha messo a disposizione della tecnologia di IBM ben 35 anni di esplorazioni e database ma solo nell’ultimo periodo, con l’ingresso di Spark su IBM Bluemix nei sistemi di Seti, le ricerche hanno ottenuto una certa accelerata, con la speranza di poter spiegare, in tempi ragionevoli, qualcosa in più sull’origine dei pianeti.