L’intelligenza artificiale generativa è una branca dell’AI che si occupa di creare dati sintetici a partire da dati reali, con applicazioni diverse in vari settori e l’obiettivo di arricchire e completare le fonti di dati esistenti
L’intelligenza artificiale generativa può essere applicata a diversi tipi di dati, come immagini, testi, audio, video, dati strutturati e non strutturati. La GenAI offre numerosi vantaggi, come la possibilità di generare dati di qualità elevata, ridurre i costi e i tempi di raccolta dei dati, aumentare la varietà e la rappresentatività dei dati, e stimolare la creatività e l’innovazione. Tuttavia, la GenAI presenta anche delle sfide e dei rischi, come la difficoltà di garantire la veridicità, la trasparenza, la tracciabilità e la responsabilità dei dati generati, la potenziale violazione dei diritti di proprietà intellettuale e di protezione dei dati personali, e la possibilità di abusi e manipolazioni dei dati a fini illeciti o dannosi. Per questo motivo, è fondamentale adottare delle pratiche di governance e qualità dei dati adeguati per gestire i benefici e i pericoli delle nuove tecnologie di generazione di dati. Ci scordiamo che nella GenAI non è solo questione del miglior modello, ma sono essenziali i dati sotto di cui si “nutre” il modello, e la gestione della sicurezza degli stessi.
Il problema è che la data governance in azienda è un problema di cultura, e come tutte le attività connesse all’essere umano, necessita di un percorso sicuramente più lento della velocità con cui si sviluppa la tecnologia. Ma cosa si intende esattamente per data governance? La governance dei dati è il processo di definizione e implementazione di regole, politiche, standard, ruoli, responsabilità e procedure per la gestione dei dati all’interno di un’organizzazione o di un ecosistema. La governance dei dati ha lo scopo di garantire la qualità, la sicurezza, la conformità, la coerenza, la disponibilità e il valore dei dati per le diverse parti interessate. Purtroppo non molte aziende hanno ancora avviato questo percorso. Inoltre, per essere effettivo, deve prevedere uno spostamento della cultura del dato dai reparti IT al Business.
È fondamentale che l’IT mantenga la governance del processo e l’analisi degli impatti sulla sicurezza, mentre la mastership del dato deve trovare “casa” nella giusta divisione di Business. Quante volte vediamo ancora richiedere all’IT la generazione di un report? Una azienda che ha effettuato un percorso virtuoso può mettere a disposizione il dato come “prodotto” assegnando un data owner specifico, In questo modo, i colleghi non si limiteranno a generare report, ma potranno ottenere insights, che rappresentano il vero valore aggiunto per le aziende nel prossimo futuro. Naturalmente, su questi dati “qualificati” è possibile applicare modelli di intelligenza artificiale generativa, i quali, a loro volta, producono nuovi dati. Ciò solleva una serie di interrogativi importanti.
Chi possiede i dati generati dalla GenAI e chi ne ha il diritto di accesso, uso e condivisione? Come si assicura che i dati generati dalla GenAI siano conformi alle normative vigenti in materia di protezione dei dati personali, proprietà intellettuale, etica e sicurezza? Come si verifica che i dati generati dalla GenAI siano veritieri, accurati, completi, pertinenti e aggiornati? Come si monitora e si controlla la qualità e la provenienza dei dati generati dalla GenAI? Come si gestiscono i conflitti e le controversie legate ai dati generati dalla GenAI? Come si valuta l’impatto sociale, economico e ambientale dei dati generati dalla GenAI? In conclusione, l’intelligenza artificiale generativa è una tecnologia emergente e promettente, che offre nuove opportunità e sfide per la gestione dei dati. Per sfruttare al meglio il suo potenziale, è indispensabile adottare pratiche di governance e qualità dei dati adeguati, che garantiscano la conformità, la trasparenza, la responsabilità e il valore dei dati generati. La governance e la qualità dei dati richiede un approccio olistico, collaborativo e specifico, che coinvolga tutte le parti interessate e che utilizzi dei framework, dei modelli, degli strumenti, dei metodi e delle tecniche appositi. Solo così si potrà assicurare che i dati generati dalla GenAI siano di qualità elevata, sicuri, etici e utili per la società e per l’economia.
Luca Seravalli IT director di Duferco Energia e delegato regionale Liguria – CIO Club Italia