Il giorno dopo Natale, una piccola start-up cinese chiamata DeepSeek ha presentato un nuovo sistema di intelligenza artificiale che potrebbe eguagliare le capacità dei chatbot all’avanguardia di aziende come OpenAI e Google.
Già solo quella sarebbe stata una pietra miliare. Ma il team dietro il sistema, chiamato DeepSeek-V3, ha descritto un passo ancora più grande. Nell’a documento di ricerca Spiegando come hanno costruito la tecnologia, gli ingegneri di DeepSeek hanno affermato di aver utilizzato solo una frazione dei chip di computer altamente specializzati su cui le principali aziende di intelligenza artificiale facevano affidamento per addestrare i loro sistemi.
Questi chip sono al centro di una tesa competizione tecnologica tra Stati Uniti e Cina. Mentre il governo degli Stati Uniti lavora per mantenere la leadership del Paese nella corsa globale all’intelligenza artificiale, sta cercando di limitare il numero di chip potenti, come quelli prodotti dall’azienda Nvidia della Silicon Valley, che possono essere venduti alla Cina e ad altri rivali.
Ma la performance del modello DeepSeek solleva interrogativi sulle conseguenze indesiderate delle restrizioni commerciali del governo americano. I controlli hanno costretto i ricercatori cinesi a essere creativi con un’ampia gamma di strumenti liberamente disponibili su Internet.
Il chatbot di DeepSeek ha risposto a domande, risolto problemi logici e scritto i propri programmi per computer con la stessa abilità di qualsiasi cosa già presente sul mercato, secondo i test di riferimento utilizzati dalle aziende americane di intelligenza artificiale.
Ed è stato creato a buon mercato, sfidando l’idea prevalente secondo cui solo le più grandi aziende del settore tecnologico – tutte con sede negli Stati Uniti – potevano permettersi di realizzare i sistemi di intelligenza artificiale più avanzati. Gli ingegneri cinesi hanno affermato di aver bisogno solo di circa 6 milioni di dollari in potenza di calcolo per costruire il loro nuovo sistema. Si tratta di circa 10 volte meno di quanto il gigante tecnologico Meta ha speso per costruire la sua ultima tecnologia AI.
“Il numero di aziende che hanno 6 milioni di dollari da spendere è di gran lunga maggiore del numero di aziende che hanno 100 milioni o 1 miliardo di dollari da spendere”, ha affermato Chris V. Nicholson, un investitore della società di venture capital Page One Ventures, che si concentra su Tecnologie di intelligenza artificiale.
Da quando OpenAI ha innescato il boom dell’intelligenza artificiale nel 2022 con il rilascio di ChatGPTmolti esperti e investitori erano giunti alla conclusione che nessuna azienda poteva competere con i leader del mercato senza spendere centinaia di milioni di dollari in chip specializzati.
Le principali aziende di intelligenza artificiale del mondo addestrano i loro chatbot utilizzando supercomputer che utilizzano fino a 16.000 chip, se non di più. Gli ingegneri di DeepSeek, d’altra parte, hanno affermato di aver bisogno solo di circa 2.000 chip per computer specializzati di Nvidia.
I vincoli sui chip in Cina hanno costretto gli ingegneri di DeepSeek a “addestrarlo in modo più efficiente in modo che potesse ancora essere competitivo”, ha affermato Jeffrey Ding, un assistente professore alla George Washington University specializzato in tecnologie emergenti e relazioni internazionali.
All’inizio di questo mese, l’amministrazione Biden ha emanato nuove regole che mirano a impedire alla Cina di ottenere chip di intelligenza artificiale avanzati attraverso altri paesi. Le regole si basano su molteplici serie di restrizioni precedenti che impediscono alle aziende cinesi di acquistare o produrre chip per computer all’avanguardia. Il presidente Trump non ha ancora indicato se rispetterà le regole o le abrogherà.
Il governo degli Stati Uniti ha cercato di tenere i chip avanzati fuori dalle mani delle aziende cinesi per paura che potessero essere utilizzati per scopi militari. In risposta, alcune aziende in Cina hanno accumulato migliaia di chip, mentre altre li hanno acquistati da a fiorente mercato sotterraneo dei contrabbandieri.
DeepSeek è gestito da una società di compravendita di azioni quantitativa chiamata High Flyer. Entro il 2021, aveva incanalato i suoi profitti nell’acquisizione di migliaia di chip Nvidia, che utilizzava per addestrare i suoi modelli precedenti. L’azienda, che non ha risposto alle richieste di commento, è diventata nota in Cina per aver raccolto talenti freschi dalle migliori università con la promessa di stipendi elevati e la capacità di seguire le domande di ricerca che più suscitano il loro interesse.
Zihan Wang, un ingegnere informatico che ha lavorato su un precedente modello DeepSeek, ha affermato che l’azienda assume anche persone senza alcuna conoscenza informatica per aiutare la tecnologia a comprendere ed essere in grado di generare poesie e domande eccellenti sul notoriamente difficile esame di ammissione all’università cinese.
DeepSeek non realizza prodotti per i consumatori, lasciando che i suoi ingegneri si concentrino interamente sulla ricerca. Ciò significa che la sua tecnologia non è vincolata agli aspetti più severi delle normative cinesi sull’intelligenza artificiale, che richiedono che la tecnologia rivolta ai consumatori rispetti i controlli del governo sulle informazioni.
Le principali aziende americane continuano a far avanzare lo stato dell’arte nell’intelligenza artificiale. A dicembre OpenAI ha presentato a nuovo sistema di “ragionamento” denominato o3 che supera le prestazioni delle tecnologie esistenti, sebbene non sia ancora ampiamente disponibile al di fuori dell’azienda. Ma DeepSeek continua a dimostrare di non essere molto indietro. Questo mese ha pubblicato un suo impressionante modello di ragionamento.
(Il New York Times ha citato in giudizio OpenAI e il suo partner Microsoft li accusano di violazione del copyright dei contenuti di notizie relativi ai sistemi di intelligenza artificiale. OpenAI e Microsoft hanno negato tali affermazioni.)
Una parte cruciale di questo mercato globale in rapida evoluzione è una vecchia idea: il software open source. Come molte altre aziendeDeepSeek ha reso open source il suo ultimo sistema di intelligenza artificiale, il che significa che ha condiviso il codice sottostante con altre aziende e ricercatori. Ciò consente ad altri di creare e distribuire i propri prodotti utilizzando le stesse tecnologie.
Mentre i dipendenti delle grandi aziende tecnologiche cinesi si limitano a collaborare con i colleghi, “se lavori sull’open source, lavori con talenti da tutto il mondo”, ha affermato Yineng Zhang, ingegnere capo del software presso Baseten a San Francisco che lavora sull’open source SGLang. progetto. Aiuta altre persone e aziende a creare prodotti utilizzando il sistema DeepSeek.
L’ecosistema open source per l’intelligenza artificiale ha preso piede nel 2023 quando Meta ha condiviso liberamente un sistema di intelligenza artificiale chiamato LLama. Molti presumevano che questa comunità sarebbe prosperata solo se aziende come Meta – giganti della tecnologia con enormi data center pieni di chip specializzati – avessero continuato a rendere open source le loro tecnologie. Ma DeepSeek e altri hanno dimostrato che anche loro possono espandere i poteri delle tecnologie open source”.
Molti dirigenti ed esperti hanno sostenuto che le grandi aziende statunitensi non dovrebbero rendere open source le loro tecnologie perché potrebbero essere utilizzati per diffondere disinformazione o causare altri danni gravi. Alcuni legislatori statunitensi hanno esplorato la possibilità di prevenire o limitare la pratica.
Ma altri sostengono che se le autorità di regolamentazione soffocassero il progresso della tecnologia open source negli Stati Uniti, la Cina otterrebbe un vantaggio significativo. Se le migliori tecnologie open source provengono dalla Cina, sostengono, gli sviluppatori statunitensi costruiranno i loro sistemi su quelle tecnologie. Nel lungo termine, ciò potrebbe mettere la Cina al centro della ricerca e dello sviluppo dell’IA.
“Il centro di gravità della comunità open source si è spostato in Cina”, ha affermato Ion Stoica, professore di informatica all’Università della California, Berkeley. “Questo potrebbe rappresentare un enorme pericolo per gli Stati Uniti”, perché consente alla Cina di accelerare lo sviluppo di nuove tecnologie.
Alcune ore dopo il suo insediamento, il presidente Trump ha annullato un ordine esecutivo dell’amministrazione Biden che minacciava di frenare le tecnologie open source.
Il dottor Stoica e i suoi studenti hanno recentemente costruito un sistema di intelligenza artificiale chiamato Sky-T1 che rivaleggia con le prestazioni dell’ultimo sistema OpenAI, chiamato OpenAI o1, su alcuni test di riferimento. Avevano bisogno di solo 450 dollari in potenza di calcolo.
Lo hanno fatto basandosi su due tecnologie open source rilasciate dal colosso tecnologico cinese Alibaba.
Il loro sistema da $ 450 non è potente come la tecnologia di OpenAI o il nuovo sistema di DeepSeek. Ed è improbabile che le tecniche utilizzate producano sistemi che superino le prestazioni delle tecnologie leader. Ma il progetto ha dimostrato che anche le operazioni con risorse minuscole possono costruire sistemi competitivi.
Reuven Cohen, un consulente tecnologico a Toronto, utilizza DeepSeek-V3 dalla fine di dicembre. Dice che è paragonabile agli ultimi sistemi di OpenAI, Google e della start-up Anthropic di San Francisco – e molto più economico da usare.
“DeepSeek è per me un modo per risparmiare denaro”, ha affermato. “Questo è il tipo di tecnologia che qualcuno come me vuole utilizzare”.