Un supercomputing in crowdsourcing per studiare il DNA

IBM collabora con un’università australiana e con un istituto sanitario brasiliano per esaminare i grandi dati genomici utilizzando il World Community Grid

Che cosa hanno in comune il DNA presente nelle alghe australiane, le acque del Rio delle Amazzoni, le piante tropicali e il terreno boschivo? Molto, affermano gli scienziati. E comprendere le similarità genetiche di forme di vita disparate potrebbe consentire ai ricercatori di produrre composti per nuovi medicinali, materiali ecologici, colture più resilienti e aria, acqua ed energia più pulite.

TI PIACE QUESTO ARTICOLO?

Iscriviti alla nostra newsletter per essere sempre aggiornato.

Confrontare le proteine codificate dai geni di svariate forme di vita è l’obiettivo di Uncovering Genome Mysteries, un nuovo progetto ospitato su World Community Grid di IBM.

Gestito dall’UNSW Australia e dall’Oswaldo Cruz Institute brasiliano, il progetto intende eseguire circa 20 quadrilioni di confronti tra 200 milioni di proteine, alla base di un’ampia varietà di organismi. Un’impresa titanica di questo genere richiederebbe di norma a un singolo computer di eseguire calcoli per 40.000 anni senza interruzioni, ma grazie alla potenza di calcolo del World Community Grid la durata si ridurrà a solo qualche mese.

Ciò è possibile perché World Community Grid di IBM, il supercomputer in crowdsourcing gratuito, che festeggia un decennio di ricerca d’avanguardia su tematiche di interesse umanitario, utilizza la disponibilità e la potenza dei computer di migliaia di volontari sparsi per il mondo. Questi volontari hanno scaricato un’app che prende in prestito la potenza inutilizzata dei dispositivi informatici in momenti in cui essi non servono agli utenti, ad esempio durante una pausa breve o prolungata dal lavoro. La scalabilità di questo supercomputer virtuale offre agli scienziati la capacità pressoché illimitata di lavorare con enormi quantità di dati, senza alcun costo.

Leggi anche:  Stati Generali della Sostenibilità Digitale, l’AI al centro della terza edizione

Anche se il progetto elaborerà le sequenze proteiche da varie forme di vita, dedicherà particolare attenzione ai microrganismi, per via della loro onnipresenza e della loro importanza. I microrganismi che vivono all’interno e sopra il corpo umano, ad esempio, sono 10 volte più numerosi delle cellule umane vere e proprie. Essi controllano un’enorme varietà di processi naturali importanti per la salute umana (i batteri intestinali favoriscono la digestione e riducono le allergie), la produzione alimentare (il lievito per la panificazione aumenta la resa, accelera la preparazione e migliora il gusto), l’agricoltura e l’acquacoltura (i batteri eliminano le impurità). I microrganismi sono stati utilizzati per depurare le acque negli impianti di trattamento delle acque fognarie e anche per ripulire le maree nere in seguito a sversamenti di petrolio. I microrganismi nelle piante tropicali esotiche si dimostrano promettenti come fonti di carburante efficienti e sostenibili.

Tuttavia, la maggior parte di queste scoperte è stata effettuata attraverso un processo per tentativi ed errori, oneroso in termini di tempo. Una migliore comprensione dei loro geni e delle proteine corrispondenti potrebbe accelerare lo sviluppo di tecnologie e soluzioni pratiche. Nonostante la loro importanza per la salute del nostro pianeta, i microrganismi sono difficili da analizzare a causa delle dimensioni minuscole, del loro grande numero e della incredibile varietà. Cercare geni utili in organismi sconosciuti rappresenta un compito arduo per gli scienziati. Un piccolo campione di acqua o terreno può contenere decine di migliaia di organismi, e ogni organismo può avere migliaia di geni. L’accelerazione dei cambiamenti climatici e la scomparsa dell’habitat hanno fatto dell’identificazione e dell’analisi del DNA una corsa contro il tempo.

Un approccio all’individuazione dei “superpoteri” nascosti della natura è analizzare il corredo genetico dei diversi organismi, per comprenderne il funzionamento. Si è sempre trattato di un processo oneroso in termini di tempo e denaro, ma negli ultimi anni gli scienziati hanno sviluppato metodi più economici e affidabili per decodificare il DNA. Devono comunque condurre ulteriori studi per scoprire la funzione di ogni gene e la sua proteina corrispondente.

Leggi anche:  Sostenibilità ambientale: Open Hub Med ottiene la certificazione ISO 14001

Di conseguenza, il progetto Uncovering Genome Mysteries intende produrre un database di informazioni sul confronto delle sequenze proteiche, a cui tutti gli scienziati possano attingere. I leader del progetto sperano che ciò possa portare a identificare nuove funzioni geniche, a scoprire come gli organismi interagiscono tra loro e con l’ambiente e a comprendere meglio come i microrganismi si modificano a causa delle sollecitazioni ambientali, ad es. i cambiamenti climatici.

World Community Grid

Creato e gestito da IBM, World Community Grid fornisce agli scienziati potenza di calcolo sfruttando il tempo di ciclo inutilizzato dei computer e dei dispositivi mobili dei volontari. Il software riceve, completa e restituisce agli scienziati piccoli compiti computazionali. La potenza combinata apportata da centinaia di migliaia di volontari ha creato uno dei supercomputer virtuali più veloci del pianeta, facendo progredire il lavoro scientifico di centinaia di anni.

Quasi tre milioni di computer e dispositivi mobili utilizzati da più di 670.000 persone e 460 istituzioni di 80 paesi hanno portato potenza di supercomputing virtuale per i progetti su World Community Grid, negli ultimi dieci anni. Dall’inizio del programma, i volontari di World Community Grid hanno alimentato più di 20 progetti di ricerca, donando quasi un milione di anni di tempo di calcolo alla ricerca scientifica, e hanno contribuito a realizzare importanti progressi scientifici nel campo della salute e della sostenibilità. IBM invita i ricercatori a presentare le proposte di progetti di ricerca per ricevere questa risorsa gratuita e invita il pubblico a donare la potenza inutilizzata dei loro computer a queste iniziative, sul sito worldcommunitygrid.org.

World Community Grid è supportato dal software sviluppato nel 2002 da Berkeley Open Infrastructure for Network Computing (BOINC) presso la University of California di Berkeley e con il sostegno della National Science Foundation. Il progetto BOINC dirige gli aspetti tecnici della potenza di calcolo fornita dai volontari.

Leggi anche:  Apple userà il chip M2 Ultra sul cloud per l’IA