Guidare le aziende nell’adozione consapevole della tecnologia per mettere in luce il valore dei dati sintetici e la necessità di un approccio strategico
Un calderone entro cui mettere tutto quello che, anche erroneamente, viene accostato all’intelligenza artificiale generativa. Il rischio è di creare un quantitativo di confusione maggiore di quanto non ve ne sia già adesso. Aziende, grandi o piccole che siano, sentono parlare da svariati mesi di GenAI, con la voglia di salire su un carro che, anche se non è detto perda le sue ruote, può condurre verso lidi lontani, anche troppo, privi di una meta condivisa.
“Condurre i clienti in maniera consapevole, ragionata, nel percorso di adozione dell’IA generativa è ciò che ci sta più a cuore” ci spiega Nicola Scarfone, Generative AI Team Leader di SAS. Un modus operandi che, se già fa parte del DNA di SAS, oggi più che mai sentiamo di dover mettere in pratica, per aiutare le organizzazioni a rientrare degli investimenti nel campo dell’innovazione tecnologica”. Una prima, forse banale ma non per tutti, distinzione che si deve fare è quella tra LLM e intelligenza artificiale generativa. “Spesso l’attenzione si concentra sui Large Language Model (LLM) come ChatGPT, che generano testo in modo sorprendente. Tuttavia, è importante ricordare che l’IA generativa va ben oltre gli LLM. Questo campo in rapida evoluzione comprende una varietà di modelli in grado di creare diversi tipi di contenuti, come immagini, musica, codice, dati e persino video. Soluzioni che, alimentate da algoritmi avanzati e reti neurali, stanno aprendo a nuove possibilità in diversi settori. Per cogliere appieno il suo potenziale, è fondamentale guardare oltre i soli LLM e abbracciare la diversità e la vastità di questo affascinante campo”.
Ridurre l’hype a fattualità
L’hype sulla GenAI è ancora forte e ha investito aziende di qualsiasi settore, ponendo in evidenza anche delle problematiche. “Come si gestiscono i dati che vengono integrati nelle piattaforme di intelligenza artificiale? Quali output producono? Quanto è possibile fidarsi delle informazioni?” prosegue il manager. “L’IA generativa si basa su enormi quantità di dati per l’addestramento. È fondamentale assicurarsi che questi dati siano di alta qualità, privi di bias e provenienti da fonti affidabili. Dati errati o incompleti possono portare a risultati distorti o inaccurati. L’integrazione di dati sensibili nelle piattaforme di IA generativa solleva inoltre preoccupazioni sulla privacy e la sicurezza, bisogna quindi sviluppare meccanismi di controllo e validazione per garantire che le informazioni generate siano corrette e appropriate”.
Vale la pena ricordare che, stando al più recente MarketScape di IDC, SAS è ancora leader nel quadrante delle operations platforms, proprio grazie ad una piattaforma altamente performante e scalabile, una governance IA completa e numerose funzionalità automatizzate. “Vuol dire avere la capacità di partire da un’idea di laboratorio e scaricarla in produzione. Come tutte le innovazioni tecnologiche, l’IA non ha avuto, e non ha tutt’oggi, un impatto univoco sulle industry. Ci sono gli innovatori e quelli che possiamo considerare follower. Il mondo della comunicazione digitale, dei creativi, è stato forse il primo a sfruttare pienamente l’IA generativa. Tra i settori più attivi, vediamo telco, retail e il finance. Si tratta di segmenti che, quando si muovono, lo fanno perché vedono del valore nelle novità proposte, sperimentando di più, soprattutto negli LLM. Inoltre il finance sta iniziando a rivolgersi ai dati sintetici, che rappresenteranno la next big thing dell’IA Generativa”.
L’importanza dei dati sintetici
I dati sintetici stanno emergendo come una risorsa fondamentale nell’era digitale. Non solo offrono una soluzione efficace per superare le limitazioni legate alla disponibilità, al costo e alla privacy dei dati reali, ma aprono anche nuove strade per l’innovazione e lo sviluppo dell’intelligenza artificiale. “Tutto parte dalla qualità del dato, tema dal quale ne scaturiscono altri due: quello della qualità del dato in senso stretto, che porta al dato sintetico, e quello della qualità del processo complessivo, volto a evitare che i dati generati sinteticamente generino inconsistenza e errori marchiani nello sviluppo dei modelli addestrati con essi. Siamo al cospetto di dati creati in modalità artificiale, con lo scopo di replicare la controparte reale. Non si tratta di duplicati ma di dataset con le stesse caratteristiche statistiche dei dati originali. Ciò permette di preservare la privacy e di velocizzare nuovi sviluppi e operazioni”. Quest’ultimo punto è fondamentale, vista la possibilità di costruire un dataset sintetico, che genera record simili ma non identici alla fonte, da usare nel tempo senza il rischio di ledere la riservatezza di individui o di scenari macro, con informazioni sensibili.
Il dato sintetico va incontro però a tre diverse problematiche. La prima è la qualità intesa come rappresentatività del dato reale: il dato sintetico deve essere uguale nelle caratteristiche e nelle funzionalità, ma non nell’aspetto. Poi, il dato sintetico non deve essere riconducibile a quello reale, non deve duplicarlo né deve contenere al suo interno pattern che consentano di risalire all’informazione originaria. Infine, deve avere la capacità di essere utilizzato per sviluppare modelli analitici robusti, in grado di performare correttamente anche quando poi vengono applicati sui corrispettivi dati reali. Uno scenario complesso a cui SAS ha risposto con l’acquisizione del software di dati sintetici Hazy, una mossa strategica per rafforzare ulteriormente l’offerta nel campo dei dati e dell’intelligenza artificiale. L’obiettivo è fornire ai clienti strumenti avanzati per la generazione di dati sintetici, e portare avanti un vero processo di democratizzazione nell’utilizzo degli strumenti di intelligenza artificiale.
A tal fine, SAS ha sviluppato anche l’ecosistema dei copilot. Moduli che, aggiunti ad una soluzione specifica, riescono a suggerire alcune operazioni, analisi e task da compiere. Un caso di implementazione introdotto da SAS è volto a costruire audience di riferimento per segmentare i clienti ai fini della personalizzazione delle campagne di marketing. “Possiamo chiedere al copilot di generare, automaticamente, dei gruppi di persone, semplicemente interagendo in una finestra di chat. Si tratta di un processo di semplificazione nell’uso delle funzionalità che rende più semplice, per tutte le imprese, ottimizzare il loro lavoro. Il passo successivo vedrà gli agenti non solo suggerire ma anche potenzialmente operare senza input diretti, in contesti comunque controllati. Non vorrà dire sostituire l’uomo ma renderlo più smart, con capacità aumentate, innalzando la necessità di produrre valore al di là dell’automazione in sé”.
Cosa ci aspetta in futuro dall’IA? “Avremo più efficienza nei processi ed efficacia nelle analisi. Ma non da domattina: questi flussi richiedono tempo per essere intesi e intrapresi, metabolizzati dalle imprese. C’è il tempo per individuare le migliori applicazioni possibili, caso per caso, così da calarle e personalizzarle in maniera puntuale”.