Una serie di autori afferma che il colosso ha sfruttato le loro opere senza pagarli
Sta diventando difficile tenere il passo con le cause legali sul copyright contro l’intelligenza artificiale generativa. Una nuova proposta di azione collettiva intende portare in tribunale Nvidia per la sua piattaforma AI NeMo, un modello linguistico che consente alle aziende di creare e addestrare i propri chatbot. I fautori affermano che la società ha addestrato il modello su un set di dati controverso che ha utilizzato illegalmente i loro libri senza consenso. Gli autori Abdi Nazemian, Brian Keene e Stewart O’Nan hanno chiesto un processo chiedendo a Nvidia di pagare i danni e distruggere tutte le copie del set di dati Books3 utilizzato per alimentare i modelli linguistici di grandi dimensioni (LLM) di NeMo. Per gli utenti ritenuti danneggiati, il set di dati ha copiato una libreria ombra chiamata Bibliotek composta da 196.640 libri piratati.
“In sintesi, Nvidia ha ammesso di aver addestrato i suoi modelli NeMo Megatron su una copia del set di dati di The Pile” si legge nella causa. “Pertanto, Nvidia ha addestrato i suoi modelli NeMo Megatron su una copia di Books3, che fa parte di The Pile. Alcuni libri scritti dai querelanti fanno parte di Books3, comprese le opere violate, e quindi Nvidia si sarebbe basata su più opere violate, andando contro i diritti d’autore dei querelanti. In risposta, Nvidia ha sottolineato al Wall Street Journal di “rispettare i diritti di tutti i creatori di contenuti e credere di aver creato NeMo nel pieno rispetto delle leggi sul copyright”. L’anno scorso, OpenAI e Microsoft hanno dovuto fronteggiare una causa sul copyright da parte di autori di saggistica, sostenendo che le società guadagnavano dai loro lavori ma si rifiutavano di pagarli. Una causa simile è stata avviata all’inizio di quest’anno. Si ricorda poi una causa intentata da testate giornalistiche come The Intercept e Raw Story e l’azione legale che ha dato il via al “trend” attuale, attuata dal New York Times.