Synthetic Data: la frontiera analitica del business

Red Hat supporta l’innovazione dell’AI generativa con nuove funzionalità di Red Hat Enterprise Linux AI

CRIF ha sviluppato una suite analitica che abilita l’adozione dei dati sintetici per un innovativo approccio data driven

Per migliorare l’efficienza operativa e innovare offerta e modelli di business, i dati svolgono un ruolo chiave. Un robusto approccio data driven è spesso condizionato però dalla natura sensibile dei dati di cui è necessario tenere conto in contesti altamente regolamentati. Le metodologie tradizionali per gestire la privacy – anonimizzazione, data masking, ecc. – portano sempre a una perdita di informazioni. Un approccio innovativo si basa sui Synthetic Data: dati ottenuti attraverso un processo di AI generativa basato sull’apprendimento delle proprietà statistiche dai dati reali. Il loro utilizzo è di particolare interesse in tutti gli ambiti che necessitano di enormi quantità di dati per migliorare processi o sperimentare nuovi modelli interpretativi, come ad esempio il settore finanziario, assicurativo, energetico, delle telecomunicazioni e retail. Questa metodologia consente inoltre di condividere informazioni non più sensibili con attori terzi quali università, centri di ricerca e società di consulenza o hub di data scientist che, pur facendo parte delle stesse organizzazioni, sono localizzati in paesi con regolamentazioni differenti per quanto riguarda il trattamento dei dati.

TI PIACE QUESTO ARTICOLO?

Iscriviti alla nostra newsletter per essere sempre aggiornato.

Ma non c’è solo la ricerca. Poiché i dati sintetici non perdono le loro proprietà statistiche, in forma aggregata possono alimentare processi decisionali data driven. Sono già numerose le grandi organizzazioni che li utilizzano, tra cui Amazon, American Express, la Financial Conduct Authority inglese e il circuito mondiale dei pagamenti SWIFT. In funzione del dato reale su cui è stato generato il dato sintetico sarà possibile dare indicazioni, ad esempio, su trend di rischiosità creditizia per tipologia di affidamento; di mercato legati a determinate tipologie di spesa; di risparmio per area geografica e profilo della controparte e, più in generale, previsione e simulazione di scenari futuri.

Leggi anche:  Metà degli italiani non si sente a proprio agio nell’ammettere di usare l’AI a lavoro

Il mercato dei Synthetic Data è in crescita e già oggi offre svariate soluzioni specializzate nella loro generazione ma non esiste una metodologia consolidata per valutare la qualità dei dati generati. Per questo motivo CRIF ha messo a punto una metodologia innovativa che verifica contemporaneamente la qualità dei dati sintetici, in termini di similarità e di mantenimento delle caratteristiche multivariate rispetto ai dati reali, e il rispetto della privacy. Il risultato è DAISYnt (aDoption of Artificial Intelligence SYnthesis), una suite di test avanzati, che stabilisce, de facto, uno standard per la valutazione dei dati sintetici.

DAISYnt consente ai team analytics di CRIF e ai suoi clienti di utilizzare la potenza dei dati sintetici per migliorare le performance dei modelli di machine learning e ridurre il biasing, in osservanza alle linee guida europee nello sviluppo di modelli etici. Inoltre la suite permette di creare a partire da dati sensibili campioni di dati sintetici che possono essere condivisi senza rischi con terze parti per la validazione di soluzioni innovative, il test di processi di integrazione IT e il coinvolgimento di team di consulenza specializzati in soluzioni data driven.

La suite viene proposta da CRIF all’interno della propria piattaforma analitica per lo sviluppo e il monitoraggio di modelli di AI e Machine Learning attraverso un servizio di sintetizzazione e di valutazione dei dati sintetici che è stato realizzato assieme ad ANONOS, azienda americana specializzata nelle Privacy Enhancing Technology.