Skip to main content

Il Paese ha investito miliardi in infrastrutture per l’intelligenza artificiale, ma la corsa all’oro dei data center si sta esaurendo a causa degli investimenti speculativi che si scontrano con una domanda debole e di DeepSeek che sposta le tendenze dell’IA.

Circa un anno fa, Xiao Li vedeva inondazioni di offerte di chip Nvidia su WeChat. Da imprenditore immobiliare a responsabile di progetti di centri dati, nel 2023 si era dedicato alle infrastrutture di intelligenza artificiale, attirato dalla promessa della mania cinese per l’IA.

All’epoca, i commercianti della sua cerchia si vantavano di essersi assicurati spedizioni di GPU Nvidia ad alte prestazioni che erano soggette a restrizioni di esportazione negli Stati Uniti. Molte sono state contrabbandate a Shenzhen attraverso canali esteri. All’apice della domanda, un singolo chip Nvidia H100, un tipo di chip essenziale per l’addestramento dei modelli di intelligenza artificiale, poteva essere venduto fino a 200.000 yuan (28.000 dollari) sul mercato nero.

Ora, il suo feed WeChat e le chat di gruppo del settore raccontano una storia diversa. I commercianti sono più discreti nelle loro transazioni e i prezzi sono tornati a scendere. Nel frattempo, due progetti di data center che Li conosce bene stanno lottando per assicurarsi ulteriori finanziamenti da parte di investitori che prevedono scarsi profitti, costringendo i responsabili del progetto a vendere le GPU in eccesso. “Sembra che tutti vendano, ma pochi comprino”, afferma Li.

Solo pochi mesi fa, il boom della costruzione di data center era al culmine, alimentato da investitori pubblici e privati. Tuttavia, molte strutture di nuova costruzione sono ora vuote. Secondo le persone che hanno parlato con MIT Technology Review – tra cui appaltatori, un dirigente di un’azienda di server GPU e responsabili di progetto – la maggior parte delle aziende che gestiscono questi data center sta lottando per rimanere a galla. Le testate locali cinesi Jiazi Guangnian e 36Kr riportano che fino all’80% delle risorse informatiche cinesi di nuova costruzione rimane inutilizzato.

L’affitto di GPU alle aziende che ne hanno bisogno per l’addestramento di modelli di IA – il principale modello di business per la nuova ondata di data center – era un tempo considerato una scommessa sicura. Ma con l’ascesa di DeepSeek e l’improvviso cambiamento dell’economia dell’IA, il settore sta vacillando.

“Il crescente dolore che l’industria cinese dell’IA sta attraversando è in gran parte il risultato di operatori inesperti – aziende e governi locali – che sono saltati sul treno dell’hype, costruendo strutture che non sono ottimali per le esigenze attuali”, afferma Jimmy Goodrich, consulente senior per la tecnologia della RAND Corporation.

Il risultato è che i progetti stanno fallendo, l’energia viene sprecata e i data center sono diventati “beni in sofferenza” che gli investitori sono desiderosi di scaricare a prezzi inferiori a quelli di mercato. Secondo l’esperto, la situazione potrebbe richiedere l’intervento del governo: “È probabile che il governo cinese intervenga, prenda in mano la situazione e li affidi a operatori più capaci”.

Un boom edilizio caotico

Quando ChatGPT è esploso sulla scena alla fine del 2022, la risposta della Cina non si è fatta attendere. Il governo centrale ha designato l’infrastruttura AI come priorità nazionale, esortando i governi locali ad accelerare lo sviluppo dei cosiddetti smart computing center, termine coniato per descrivere i centri dati incentrati sull’AI.

Secondo KZ Consulting, una società di ricerche di mercato, nel 2023 e nel 2024 sono stati annunciati oltre 500 nuovi progetti di data center ovunque, dalla Mongolia interna al Guangdong. Secondo il China Communications Industry Association Data Center Committee, un’associazione di settore affiliata allo Stato, almeno 150 dei nuovi data center costruiti erano già pronti e funzionanti entro la fine del 2024. Le imprese statali, le società quotate in borsa e i fondi statali hanno fatto la fila per investirvi, nella speranza di posizionarsi come leader dell’IA. I governi locali li hanno fortemente promossi nella speranza che stimolassero l’economia e facessero della loro regione un hub chiave per l’IA.

Tuttavia, mentre questi costosi progetti di costruzione continuano, la frenesia cinese per i grandi modelli linguistici sta perdendo slancio. Solo nel 2024, oltre 144 aziende si sono registrate presso la Cyberspace Administration of China, l’autorità centrale di regolamentazione di Internet, per sviluppare i propri LLM. Tuttavia, secondo l’Economic Observer, una pubblicazione cinese, alla fine dell’anno solo il 10% circa di queste aziende stava ancora investendo attivamente nella formazione di modelli su larga scala.

Il sistema politico cinese è altamente centralizzato, con i funzionari del governo locale che di solito salgono di grado attraverso nomine regionali. Di conseguenza, molti leader locali danno la priorità a progetti economici a breve termine che dimostrino risultati rapidi – spesso per guadagnare il favore dei piani alti – piuttosto che allo sviluppo a lungo termine. I grandi progetti infrastrutturali di alto profilo sono stati a lungo uno strumento per i funzionari locali per incrementare le loro carriere politiche.

La recessione economica post-pandemia ha solo intensificato questa dinamica. Con il settore immobiliare cinese – un tempo spina dorsale delle economie locali – che crolla per la prima volta da decenni, i funzionari si sono affannati a trovare motori di crescita alternativi. Nel frattempo, anche l’industria di Internet, un tempo molto vivace, stava entrando in un periodo di stagnazione. In questo vuoto, le infrastrutture di intelligenza artificiale sono diventate il nuovo stimolo da scegliere.

“L’intelligenza artificiale è stata come un’iniezione di adrenalina”, afferma Li. “Molti soldi che prima confluivano nel settore immobiliare ora stanno andando nei data center AI”.

Entro il 2023, le grandi aziende, molte delle quali con poca esperienza nell’IA, hanno iniziato a collaborare con i governi locali per capitalizzare la tendenza. Alcune hanno visto nell’infrastruttura dell’IA un modo per giustificare l’espansione dell’attività o per aumentare i prezzi delle azioni, afferma Fang Cunbao, project manager di un centro dati con sede a Pechino. Tra queste ci sono aziende come Lotus, un produttore di glutammato monosodico, e Jinlun Technology, un’azienda tessile: non sono certo i nomi che si potrebbero associare a una tecnologia AI all’avanguardia.

Secondo Fang, Li e diverse fonti in loco, che hanno chiesto di parlare in forma anonima per timore di ripercussioni politiche, l’approccio “gold-rush” ha fatto sì che la spinta alla costruzione di data center per l’IA sia stata in gran parte guidata dall’alto, spesso con scarsa attenzione alla domanda effettiva o alla fattibilità tecnica. Molti progetti sono stati guidati da dirigenti e investitori con competenze limitate in materia di infrastrutture di IA. Nella fretta di tenere il passo, molti sono stati costruiti frettolosamente e non hanno rispettato gli standard del settore.

“Mettere insieme tutti questi grandi cluster di chip è un esercizio molto difficile, e ci sono pochissime aziende o individui che sanno come farlo su scala”, dice Goodrich. “Si tratta di ingegneria informatica all’avanguardia. Sarei sorpreso se la maggior parte di questi piccoli operatori sapesse come farlo. Molti dei centri dati appena costruiti sono stati messi insieme in fretta e non offrono la stabilità che una società come DeepSeek vorrebbe”.

Come se non bastasse, i responsabili dei progetti si sono spesso affidati a intermediari e broker, alcuni dei quali hanno esagerato le previsioni della domanda o manipolato i processi di approvvigionamento per intascare i sussidi governativi.

Alla fine del 2024, l’entusiasmo che un tempo circondava il boom dei data center cinesi si stava trasformando in delusione. Il motivo è semplice: Il noleggio di GPU non è più un’attività particolarmente redditizia.

La resa dei conti di DeepSeek

Il modello di business dei data center è in teoria semplice: guadagnano affittando cluster di GPU alle aziende che hanno bisogno di capacità di calcolo per l’addestramento dell’intelligenza artificiale. In realtà, però, assicurarsi i clienti si sta rivelando difficile. Solo poche aziende tecnologiche di alto livello in Cina stanno attingendo pesantemente alla potenza di calcolo per addestrare i propri modelli di IA. Molti piccoli operatori hanno rinunciato a pre-addestrare i loro modelli o hanno cambiato strategia da quando è nata DeepSeek, che ha fatto breccia in Internet con R1, il suo modello di ragionamento open-source in grado di eguagliare le prestazioni di ChatGPT o1, ma costruito a una frazione del suo costo.

“DeepSeek rappresenta un momento di svolta per l’industria cinese dell’intelligenza artificiale. La domanda più scottante si è spostata da ‘Chi può creare il miglior modello linguistico di grandi dimensioni?’ a ‘Chi può usarlo meglio?'”, afferma Hancheng Cao, assistente alla cattedra di sistemi informativi della Emory University.

L’ascesa di modelli di ragionamento come R1 di DeepSeek e ChatGPT o1 e o3 di OpenAI ha anche cambiato ciò che le aziende vogliono da un data center. Con questa tecnologia, la maggior parte del fabbisogno di calcolo deriva dall’esecuzione di deduzioni logiche passo-passo in risposta alle domande degli utenti, e non dal processo di formazione e creazione del modello in primo luogo. Questo processo di ragionamento spesso produce risultati migliori, ma richiede molto più tempo. Di conseguenza, l’hardware a bassa latenza (il tempo necessario ai dati per passare da un punto all’altro di una rete) è fondamentale. I data center devono essere situati vicino ai principali hub tecnologici per ridurre al minimo i ritardi di trasmissione e garantire l’accesso a personale operativo e di manutenzione altamente qualificato.

Questo cambiamento significa che molti data center costruiti nella Cina centrale, occidentale e rurale – dove l’elettricità e il terreno sono più economici – stanno perdendo il loro fascino per le aziende di IA. A Zhengzhou, una città della provincia natale di Li, Henan, un centro dati di recente costruzione sta addirittura distribuendo buoni di calcolo gratuiti alle aziende tecnologiche locali, ma fatica ancora ad attirare clienti.

Inoltre, molti dei nuovi data center sorti negli ultimi anni sono stati ottimizzati per i carichi di lavoro di pre-training – grandi calcoli sostenuti eseguiti su enormi set di dati – piuttosto che per l’inferenza, il processo di esecuzione di modelli di ragionamento addestrati per rispondere agli input degli utenti in tempo reale. L’hardware adatto all’inferenza è diverso da quello tradizionalmente utilizzato per l’addestramento dell’intelligenza artificiale su larga scala.

Le GPU come le Nvidia H100 e A100 sono progettate per l’elaborazione massiva dei dati, privilegiando la velocità e la capacità di memoria. Ma con l’evoluzione dell’intelligenza artificiale verso il ragionamento in tempo reale, il settore cerca chip più efficienti, reattivi ed economici. Anche un piccolo errore di calcolo nelle esigenze dell’infrastruttura può rendere un data center non ottimale per le attività richieste dai clienti.

In queste circostanze, il prezzo di noleggio delle GPU è sceso ai minimi storici. Secondo un recente rapporto del media cinese Zhineng Yongxian, un server Nvidia H100 configurato con otto GPU viene ora affittato per 75.000 yuan al mese, rispetto ai massimi di circa 180.000. Secondo Fan, alcuni data center preferiscono lasciare le loro strutture vuote piuttosto che correre il rischio di perdere ancora più denaro a causa dei costi di gestione: “I ricavi derivanti dal funzionamento di una piccola parte del data center semplicemente non coprirebbero i costi di elettricità e manutenzione”.

“È paradossale: la Cina deve affrontare i costi di acquisizione più elevati per i chip Nvidia, ma i prezzi di leasing delle GPU sono straordinariamente bassi”, afferma Li. C’è un eccesso di potenza di calcolo, soprattutto nella Cina centrale e occidentale, ma allo stesso tempo c’è una carenza di chip all’avanguardia.

Tuttavia, non tutti i broker cercavano di guadagnare con i data center. Al contrario, molti erano interessati a sfruttare le agevolazioni governative fin dall’inizio. Alcuni operatori sfruttano il settore per l’elettricità verde sovvenzionata, ottenendo permessi per generare e vendere energia, secondo quanto riportato da Fang e da alcuni media cinesi. Invece di utilizzare l’energia per i carichi di lavoro dell’IA, la rivendono alla rete a un prezzo maggiorato. In altri casi, le aziende acquistano terreni per lo sviluppo di data center per ottenere prestiti e crediti garantiti dallo Stato, lasciando le strutture inutilizzate e beneficiando comunque dei finanziamenti statali, secondo quanto riportato dal media locale Jiazi Guangnian.

“Verso la fine del 2024, nessun appaltatore e intermediario lucido sul mercato entrerebbe ancora nel business aspettandosi una redditività diretta”, afferma Fang. “Tutti quelli che ho incontrato stanno sfruttando l’affare dei data center per qualcos’altro che il governo potrebbe offrire”.

Un male necessario

Nonostante il sottoutilizzo dei data center, il governo centrale cinese continua a sostenere la spinta verso le infrastrutture di IA. All’inizio del 2025, ha convocato un simposio sull’industria dell’IA, sottolineando l’importanza dell’autosufficienza in questa tecnologia.

Le principali aziende tecnologiche cinesi ne stanno prendendo atto, effettuando investimenti in linea con questa priorità nazionale. Alibaba Group ha annunciato l’intenzione di investire oltre 50 miliardi di dollari in infrastrutture hardware per il cloud computing e l’intelligenza artificiale nei prossimi tre anni, mentre ByteDance prevede di investire circa 20 miliardi di dollari in GPU e data center.

Nel frattempo, le aziende statunitensi stanno facendo altrettanto. Importanti aziende tecnologiche, tra cui OpenAI, Softbank e Oracle, si sono unite per impegnarsi nell’iniziativa Stargate, che prevede di investire fino a 500 miliardi di dollari nei prossimi quattro anni per costruire centri dati e infrastrutture informatiche avanzate. Data la competizione sull’IA tra i due Paesi, secondo gli esperti è improbabile che la Cina riduca i suoi sforzi. “Se l’IA generativa sarà la tecnologia killer, l’infrastruttura sarà il fattore determinante per il successo”, afferma Goodrich, consulente per le politiche tecnologiche di RAND.

“Il governo centrale cinese probabilmente vedrà [i data center sottoutilizzati] come un male necessario per sviluppare una capacità importante, una sorta di dolore crescente. Ci sono i progetti falliti di e le attività in difficoltà, e lo Stato consoliderà e ripulirà tutto. Vedono il fine, non i mezzi”, afferma Goodrich.

La domanda rimane forte per i chip Nvidia, in particolare per il chip H20, progettato su misura per il mercato cinese. Una fonte del settore, che ha chiesto di non essere identificata in base alla sua politica aziendale, ha confermato che l’H20, un modello più leggero e veloce ottimizzato per l’inferenza dell’intelligenza artificiale, è attualmente il chip Nvidia più richiesto, seguito dall’H100, che continua ad affluire costantemente in Cina nonostante le vendite siano ufficialmente limitate dalle sanzioni statunitensi. Una parte della nuova domanda è determinata dalle aziende che utilizzano le proprie versioni dei modelli open-source di DeepSeek.

Per ora, molti centri dati in Cina si trovano in un limbo, costruiti per un futuro che deve ancora arrivare. Non si sa se troveranno una seconda vita. Per Fang Cunbao, il successo di DeepSeek è diventato un momento di riflessione, che mette in dubbio l’ipotesi che un’espansione infinita dell’infrastruttura AI garantisca il progresso.

È solo un mito, come ora si rende conto. All’inizio di quest’anno, Fang ha deciso di abbandonare completamente il settore dei data center. “Il mercato è troppo caotico. Gli early adopters ne hanno approfittato, ma ora c’è solo gente a caccia di scappatoie politiche”, dice. Ha deciso di dedicarsi alla formazione sull’intelligenza artificiale.

“Ciò che si frappone tra oggi e un futuro in cui l’IA è effettivamente ovunque”, afferma, “non è più l’infrastruttura, ma piani solidi per l’implementazione della tecnologia”.