DeepSeek scuote i mercati. La lezione da imparare

DeepSeek scuote i mercati. La lezione da imparare

Esperimento o mossa strategica? L’intelligenza artificiale è una tecnologia troppo potente per essere lasciata nelle mani di pochi. L’ascesa di startup come DeepSeek segna l’inizio di una nuova fase dell’AI

Il 27 gennaio 2025, la startup cinese di intelligenza artificiale DeepSeek ha scosso i mercati finanziari globali con il lancio del suo chatbot avanzato, un evento che molti hanno definito un “momento Sputnik” per l’industria dell’AI americana, segnalando l’ingresso della Cina come competitor di primo piano nella corsa tecnologica. L’impatto è stato immediato. I titoli tecnologici statunitensi hanno subito un’ondata di vendite, mentre colossi come NVIDIA hanno visto le loro azioni crollare del 17%, bruciando circa 593 miliardi di dollari di capitalizzazione di mercato. Per giorni, giornali e social non hanno parlato d’altro. Una startup quasi sconosciuta, con appena sei milioni di dollari di investimento, ha lanciato un’AI paragonabile a Chat GPT, il modello americano che invece ha richiesto costi esorbitanti di sviluppo. Ma è davvero andata così?

TI PIACE QUESTO ARTICOLO?

Iscriviti alla nostra newsletter per essere sempre aggiornato.

DeepSeek ha sì investito sei milioni di dollari nel training del modello R1, una cifra irrisoria rispetto ai 600 milioni impiegati dai concorrenti americani, ma c’è un aspetto che molti hanno trascurato: l’hardware. Quante schede NVIDIA ha utilizzato DeepSeek? Qual è stato il costo reale dell’operazione? Trecento milioni? Cinquecento? Settecento? E soprattutto, quale ruolo ha giocato il fondo che controlla DeepSeek nel mercato azionario? Mentre gli analisti finanziari cercavano di rispondere a queste domande, nelle community di investitori e trader si è diffusa l’ipotesi di una manovra speculativa orchestrata dal fondo cinese dietro DeepSeek, che avrebbe sfruttato una possibile vendita allo scoperto sui titoli del NASDAQ per trarne profitto.

Parallelamente, nei circoli della geopolitica e della tecnologia si è cominciato a parlare di un nuovo ordine mondiale, con la Cina pronta a riscrivere le regole dell’intelligenza artificiale e a consolidare il proprio dominio nel settore. Non si è trattato solo di una questione di supremazia tecnologica: molti esperti hanno sollevato dubbi sulla privacy e sulla sicurezza, ipotizzando che DeepSeek potesse raccogliere dati sensibili degli utenti e che le aziende che avrebbero adottato il suo modello potessero trovarsi di fronte a rischi legali e normativi. La confusione regna sovrana, così come le speculazioni, ma una cosa è certa: i sei milioni di dollari rappresentano esclusivamente il costo del training del modello, senza considerare gli investimenti in infrastrutture e hardware.

Leggi anche:  Cisco: al via “Programma in Rete”, il laboratorio virtuale per imparare a programmare

Come ha fatto DeepSeek a ottenere questo risultato?

Nei forum tecnici dedicati all’AI ha iniziato a diffondersi un’ipotesi ancora più controversa: e se DeepSeek avesse avuto accesso a documenti già elaborati da OpenAI, sfruttando un leak o un accesso non autorizzato? Ma andiamo con ordine. DeepSeek è nata a luglio 2023, fondata da Liang Wenfeng, imprenditore e co-fondatore di High-Flyer, un fondo speculativo guidato da intelligenza artificiale, con sede a Hangzhou. Che una realtà del genere nasca da un fondo di investimento non sorprende affatto. Il mercato azionario è ormai dominato da trading algoritmico. Alzare il livello tecnologico significa, quasi sempre, aumentare i profitti.

A gennaio 2025, la startup ha rilasciato DeepSeek-R1, dopo aver già pubblicato diversi modelli, dimostrando di poter competere con le grandi aziende americane a un costo decisamente inferiore. La particolarità di R1 è che è stato addestrato in tempi estremamente ridotti, grazie a un metodo innovativo, a partire da DeepSeek-v3, un modello rilasciato poco prima. DeepSeek-v3, pur essendo un LLM open-source simile a LLaMA, non ha fatto scalpore. Il vero punto di svolta è stato il metodo di addestramento utilizzato per R1: prima con R1-Zero e poi con R1, il tutto in un lasso di tempo sorprendentemente breve.

Ma da dove hanno ottenuto i dati per trasformare un semplice modello linguistico in un modello di ragionamento avanzato? In particolare, nella seconda fase dell’addestramento tramite apprendimento per rinforzo, sono stati utilizzati feedback umani per valutare diversi percorsi di ragionamento a partire da una stessa domanda. Tuttavia, resta un punto interrogativo: dove hanno raccolto questi dati? A quanto mi risulta, DeepSeek non disponeva di alcun servizio attivo da cui estrarre preferenze umane sulle risposte.

Modello alternativo o manovra di mercato?

L’impresa sembrava impossibile, e proprio per questo ha generato diverse teorie su come sia stato possibile ottenere un simile risultato. Una delle spiegazioni più accreditate riguarda l’uso della distillazione del modello, una tecnica che consente di ottimizzare l’addestramento riducendo il peso computazionale. Questa tecnica, sviluppata da Geoffrey Hinton nel 2015, permette di trasferire conoscenza da un modello insegnante di grandi dimensioni a un modello studente più piccolo ed efficiente, mantenendo prestazioni simili. Inizialmente, si allena un modello insegnante, in pratica si tratta di un’AI di grandi dimensioni che impara da un vasto dataset. Successivamente, il modello insegnante trasmette al modello studente non solo le risposte finali, ma anche i pattern decisionali e le probabilità associate a ogni decisione. Infine, il modello studente impara a replicare il comportamento dell’insegnante con una struttura più snella e ottimizzata. Grazie a questa tecnica, DeepSeek ha potuto ridurre drasticamente i costi, evitando di costruire da zero un modello enorme e ottenendo un’AI capace di rivaleggiare con ChatGPT, pur non avendo le stesse risorse computazionali.

Leggi anche:  IA, nasce il primo assistente virtuale per i concorsi

Il successo di DeepSeek è stato rapido, ma non privo di controversie. Alcuni esperti hanno ipotizzato che l’azienda possa aver copiato parte delle conoscenze di ChatGPT, utilizzando dati pre-addestrati in modo non autorizzato. L’azienda ha respinto queste accuse, affermando di aver addestrato i propri modelli in modo indipendente, senza alcun accesso a dataset esterni. Ma i dubbi restano, soprattutto perché in molti hanno visto nel crollo delle azioni tech americane una strategia deliberata, con DeepSeek usata come leva per destabilizzare il mercato e generare enormi profitti attraverso operazioni speculative. Quello che è certo è che DeepSeek ha dimostrato che non servono miliardi di dollari per sviluppare un’AI competitiva, ma strategie intelligenti e ottimizzate. Certo non i sei milioni di cui si parlava inizialmente, ma comunque un punto importante da tenere presente.

Quanto però di questo successo è frutto di innovazione e quanto di un’abile manovra finanziaria? La verità è che l’intelligenza artificiale è una tecnologia troppo potente per essere lasciata nelle mani di pochi. La questione non è solo chi la sviluppa meglio, ma chi ne controlla l’accesso e l’impatto. Se DeepSeek sia stato un esperimento di ottimizzazione, una mossa strategica di mercato o il primo segnale di un possibile indebolimento della leadership americana sull’AI, lo scopriremo nei prossimi anni. Quel che è certo è che la corsa all’IA non sarà più la stessa e che, forse, è un bene che questa tecnologia non sia più nelle mani di pochissimi grandi gruppi o di un numero ristretto di paesi.

L’ascesa di una startup come DeepSeek dimostra che anche realtà emergenti (anche se purtroppo ancora con investimenti importanti) possono avere un ruolo e che, in un settore così rivoluzionario, non tutto è già scritto. Forse, questa competizione crescente può portare a un’AI più democratica, dove non sono solo i colossi a dettare le regole, ma dove anche piccole aziende, laboratori indipendenti e startup specializzate in settori di nicchia possono avere un ruolo importante.

Leggi anche:  Veeam presenta nuove funzionalità enterprise con la versione 12.3 di Veeam Data Platform

E magari, proprio questa decentralizzazione potrebbe garantire che l’intelligenza artificiale sia sviluppata con più diversità, più creatività e più attenzione a bisogni specifici di mercati. Se c’è una lezione da imparare da DeepSeek, è che nel mondo dell’AI – come della finanza – c’è ancora spazio per chi osa innovare.