Serverless GPU, la forza di Kubernetes per ottimizzare l’AI

Serverless GPU, la forza di Kubernetes per ottimizzare l’AI
Adriano Pezzuto, founder di Clastix

Uso efficiente delle risorse, aumento della flessibilità e riduzione dei costi. Dietro la soluzione di Seeweb c’è un’infrastruttura Kubernetes personalizzata da Clastix, unica azienda italiana ad avere realizzato un software adottato dalla Linux Foundation

Quando si parla di intelligenza artificiale, spesso si dimentica la necessità di bilanciare bene le risorse e gli utilizzi di una tecnologia dal grosso potenziale per imprese di ogni settore e dimensione. In tale ottica, Seeweb ha lanciato nel corso dell’anno Serverless GPU, con l’obiettivo di rendere l’intelligenza artificiale più accessibile ed efficiente per le organizzazioni. Il servizio è frutto di una partnership con Clastix, azienda milanese attiva dal 2020. Con un focus sulla realizzazione di software open source per il cloud computing, Clastix ha all’attivo diverse soluzioni, tra cui Capsule, il primo e unico software italiano adottato dalla Linux Foundation, per abilitare la multi-tenancy su infrastrutture Kubernetes.

TI PIACE QUESTO ARTICOLO?

Iscriviti alla nostra newsletter per essere sempre aggiornato.

«Quest’ultimo è diventato lo standard di fatto per le infrastrutture moderne ed è adottato da tutti i principali cloud provider» – ci spiega Adriano Pezzuto, founder di Clastix. Si tratta di una piattaforma che sposa flessibilità e scalabilità, ideale anche per l’esecuzione di carichi di lavoro legati all’intelligenza artificiale. Come racconta il manager, la stessa OpenAI, che è dietro lo sviluppo di ChatGPT, ha addestrato la sua AI su cluster Kubernetes.

POTENZA DI CALCOLO DINAMICA

Pezzuto ha cominciato a interessarsi allo scenario Kubernetes dal 2016, ed è stato tra i primi a portare in Italia la tecnologia. Partendo da un caso reale, Clastix ha avuto l’idea di realizzare una soluzione in-house in grado di ottimizzare ed efficientare infrastrutture. «Un vantaggio è che si tratta di una tecnologia aperta, che consente di spostare le applicazioni da un provider all’altro, scordando per sempre il lock-in».

Leggi anche:  FINIX Technology Solutions ed expert.ai insieme per accelerare l’adozione di soluzioni di IA e NLP sul mercato italiano

Assieme a Seeweb, Clastix ha dunque dato vita a Serverless GPU, che concretizza le necessità di flessibilità ed economicità di una sorta di AI pay-per-use. «Di norma, un cliente affitta una macchina GPU per le proprie attività, ma senza sfruttarne le potenzialità lungo tutto il tempo contrattuale» – continua Pezzuto. «Basti pensare che per circa il 30% del tempo di affitto, una GPU non viene utilizzata. Lo switch da parte nostra è stato dunque rendere dinamica l’allocazione della potenza di calcolo. Quando il carico di lavoro diminuisce assegniamo la GPU a un altro cliente, per cui il costo viene calcolato sull’uso vero e proprio e non a forfait, senza un criterio». Dietro a tale implementazione, c’è una infrastruttura Kubernetes realizzata da Clastix, che ha sviluppato il software con estensioni specifiche, ponendosi come abilitatore di un servizio personalizzato.

Il beneficio è anche dal punto di vista del provider, che può allocare meglio la configurazione delle GPU, sposando le crescenti richieste di sostenibilità. «Quando è inattiva, la GPU ha un costo inferiore rispetto a quando è in funzione. Inoltre, riducendo il carico della GPU solo ai momenti necessari, si ottiene un notevole risparmio energetico. Inoltre, con il Serverless GPU, rendiamo l’accesso all’AI più democratico, aprendo le opportunità offerte dagli algoritmi ad aziende più piccole, per colmare o almeno non aumentare il gap con quelle più grandi».

Chatbot intelligenti, innovazione ed economia possono andare di pari passo
Marco Cristofanilli, head of AI Cloud Seeweb

LE IMPLEMENTAZIONI FUTURE

La Serveless GPU non copre tutte le casistiche di business. «È adatta quando si ha bisogno di capacità di calcolo aggiuntive magari per poco tempo» – conclude Pezzuto. «Ci sono esempi più ampi in cui l’approccio on-demand non è il migliore. Pensiamo al training di modelli di grosse dimensioni per i quali bisogna avere una visione più ampia. Vogliamo dunque mantenere l’esperienza assunta sul campo, grazie a Seeweb, per ampliare un utilizzo smart delle risorse hardware a 360 gradi». Clastix e Seeweb hanno raccontato la loro partnership durante i Kubernetes Community Days del 20 giugno a Bologna, l’appuntamento di riferimento, per la community di sviluppatori, architetti, ingegneri, DevOps, Ops, professionisti IT, interessati al panorama open source e cloud-native.

Leggi anche:  SAS acquisisce il software di dati sintetici Hazy per potenziare il portafoglio di intelligenza artificiale generativa

Marco Cristofanilli, head of AI Cloud Seeweb: «In Seeweb mettiamo a disposizione le migliori tecnologie per servire progetti e soluzioni di intelligenza artificiale e machine learning, oggi adottabili anche da chi dispone già di infrastrutture IT e vuole ampliarne la potenza di calcolo senza migrare nulla. Anche qui, Kubernetes si rivela lo strumento indispensabile per ottimizzare le risorse computazionali agevolandone una allocazione dinamica, in grado di abbattere gli sprechi e creare ambienti dinamici e multi-cloud».