Davide contro Golia nel mondo dell’AI. Da una parte gli Stati Uniti con il nuovo progetto “Stargate”, un impegno colossale da 500 miliardi di dollari sostenuto dai giganti della tecnologia per costruire data center in tutto il Paese. Dall’altra, una startup cinese agguerrita che ha lanciato un modello open source impressionante, sviluppato con un budget “ridicolo”.
All’inizio della settimana, DeepSeek ha presentato il suo modello R1, che secondo la startup eguaglia, se non supera, le prestazioni del modello o1 di OpenAI lanciato l’anno scorso (o1 è progettato per risolvere problemi di ragionamento e matematica).
DeepSeek ha reso i suoi modelli accessibili al pubblico, impressionando i revisori con la capacità di gestire compiti come programmazione e ragionamento.
Il lancio di R1 segue un annuncio di dicembre, in cui DeepSeek ha dichiarato di aver addestrato il suo modello linguistico V3 con un costo di soli 5,6 milioni di dollari in potenza di calcolo, molto meno dei 100+ milioni usati per GPT-4.
La startup ha affermato che il modello V3 ha ottenuto prestazioni comparabili a quelle dei modelli di OpenAI e Anthropic nei principali benchmark. Andrej Karpathy, ex esperto di AI per Tesla e OpenAI, ha elogiato DeepSeek per aver sviluppato un’AI all’avanguardia con un “budget ridicolo”.
Questi annunci hanno posizionato DeepSeek al centro della già affollata scena dell’AI cinese. Il fondatore di DeepSeek, Liang Wenfeng, 40 anni, ha incontrato lunedì il premier cinese Li Qiang, unendosi a un gruppo di esperti di settore di rilievo, secondo il South China Morning Post.
L’ascesa di DeepSeek
DeepSeek, con sede a Hangzhou, è nata da HighFlyer, un hedge fund quantitativo cinese con 10 miliardi di yuan (1,4 miliardi di dollari) in gestione nel 2019. Nel 2023, il fondo ha trasformato DeepSeek in una startup di AI per sviluppare modelli e prodotti basati sull’intelligenza artificiale.
Liang Wenfeng ha studiato intelligenza artificiale presso l’Università di Zhejiang prima di co-fondare HighFlyer, che ha acquistato migliaia di chip AI Nvidia prima delle restrizioni statunitensi del 2022. Questo vantaggio ha permesso a DeepSeek di proseguire lo sviluppo dei suoi modelli mentre altre startup lottavano per trovare risorse di calcolo.
Gli esperti di AI hanno opinioni diverse sulle prestazioni di DeepSeek rispetto a ChatGPT di OpenAI e Claude di Anthropic, suggerendo che i modelli cinesi funzionano bene in configurazioni hardware specifiche, ma hanno difficoltà in altre.
DeepSeek punta a raggiungere ciò che OpenAI e Anthropic hanno fatto, ma in modo più efficiente ed economico. I suoi modelli utilizzano innovazioni software intelligenti per superare i limiti del modello “mixture of experts”, dove diverse parti dell’AI affrontano specifiche tipologie di domande.
Un’altra differenza significativa è che il modello di DeepSeek è open source, permettendo il suo utilizzo su diversi tipi di hardware e mostrando chiaramente come arriva alle sue risposte, a differenza del modello o1 di OpenAI. Questo approccio potrebbe attrarre clienti che non possono permettersi i costosi modelli statunitensi, specialmente nei Paesi limitati nell’accesso alla potenza di calcolo americana.
Perché gli Stati Uniti temono l’AI cinese?
Secondo i funzionari statunitensi, una compagnia cinese non dovrebbe essere stata in grado di sviluppare un modello di AI all’avanguardia.
Dal 2022, gli Stati Uniti hanno limitato la vendita di chip avanzati per l’AI alla Cina, impedendo alle aziende cinesi di accedere ai processori necessari per addestrare modelli di punta. Tuttavia, i chip importati prima delle restrizioni, il mercato grigio, o alternative cinesi come i chip di Huawei (che però hanno problemi di produzione su larga scala) hanno permesso al settore di progredire.
Liang ha dichiarato: “Il denaro non è mai stato un problema per noi; le restrizioni sui chip avanzati lo sono,” in un’intervista con il portale cinese 36kr.
Nonostante le restrizioni, la Cina ha costruito un settore dell’AI vivace e diversificato. Colossi come Baidu, Alibaba e ByteDance stanno sviluppando modelli propri, mentre startup come Minimax e Moonshot AI offrono servizi innovativi anche sul mercato statunitense.
Tuttavia, la competizione interna ha portato a una guerra dei prezzi. Nel 2024, aziende come Alibaba e ByteDance hanno ridotto i prezzi fino al 90% per superare i concorrenti.
Il futuro della competizione globale
I successi della Cina nell’AI preoccupano gli Stati Uniti, suggerendo che le misure adottate per mantenere la leadership tecnologica potrebbero non bastare. L’ex CEO di Google, Eric Schmidt, ha dichiarato: “Pensavo che le restrizioni sui chip li avrebbero frenati.”
La OpenAI ha recentemente lanciato l’allarme, avvertendo che 175 miliardi di dollari globali potrebbero essere investiti in progetti di AI sostenuti dalla Cina, rafforzando l’influenza globale del Partito Comunista Cinese.
Nel frattempo, il progetto “Stargate” degli Stati Uniti mira a consolidare la propria posizione investendo massicciamente in infrastrutture AI, ma la competizione tra Davide e Golia è solo all’inizio.
L’articolo completo è su Fortune.com
Credits foto: VCG—VCG via Getty Images