
Il tanto atteso V4 è più efficiente e rappresenta una vittoria per i produttori cinesi di chip.
Venerdì scorso, l’azienda cinese di IA DeepSeek ha rilasciato un’anteprima di V4, il suo nuovo e tanto atteso modello di punta. In particolare, il modello è in grado di elaborare prompt molto più lunghi rispetto alla generazione precedente, grazie a un nuovo design che gli consente di gestire grandi quantità di testo in modo più efficiente. Come i modelli precedenti di DeepSeek, V4 è open source, il che significa che chiunque può scaricarlo, utilizzarlo e modificarlo.
V4 segna il rilascio più significativo di DeepSeek dopo R1, il modello di ragionamento lanciato nel gennaio 2025. R1, addestrato con risorse di calcolo limitate, ha sbalordito l’industria globale dell’IA con le sue elevate prestazioni ed efficienza, trasformando DeepSeek da un team di ricerca poco conosciuto nell’azienda di IA più famosa della Cina quasi dall’oggi al domani. Ha anche contribuito a innescare un’ondata di rilasci di modelli open-weight da parte di altre aziende cinesi di IA.
Da allora DeepSeek ha mantenuto un profilo relativamente basso, ma all’inizio di questo mese ha di fatto anticipato il rilascio di V4 quando ha aggiunto le modalità “expert” e “flash” alla versione online del suo modello, alimentando le speculazioni sul fatto che gli aggiornamenti fossero legati a un rilascio imminente di maggiore portata.
Sebbene l’azienda sia diventata un potente simbolo delle ambizioni cinesi nel campo dell’IA, il suo grande ritorno ai modelli all’avanguardia arriva dopo mesi di scrutinio, tra cui importanti dimissioni di personale, ritardi nel lancio dei modelli precedenti e un crescente controllo da parte dei governi sia statunitense che cinese.
Quindi, V4 sconvolgerà il settore dell’IA come ha fatto R1? Quasi certamente no, ma ecco tre grandi motivi per cui questo rilascio è importante.
1. Apre nuovi orizzonti per un modello open source.
Come per l’R1 prima di esso, DeepSeek sostiene che le prestazioni del V4 rivaleggiano con i migliori modelli disponibili a una frazione del prezzo. Questa è un’ottima notizia per gli sviluppatori e per le aziende che utilizzano la tecnologia, perché significa che possono accedere a funzionalità di IA all’avanguardia alle loro condizioni e senza preoccuparsi di costi alle stelle.
Il nuovo modello è disponibile in due versioni, entrambe accessibili sul sito web di DeepSeek e nella sua app, con accesso API aperto anche agli sviluppatori. V4-Pro è un modello più grande, progettato per la programmazione e compiti complessi degli agenti, mentre V4-Flash è una versione più piccola, progettata per essere più veloce ed economica da eseguire. Entrambe le versioni offrono modalità di ragionamento, in cui il modello può analizzare attentamente il prompt dell’utente e mostrare ogni passo mentre elabora il problema.
Per V4-Pro, DeepSeek addebita 1,74 dollari per milione di token in ingresso e 3,48 dollari per milione di token in uscita, una frazione del costo di modelli comparabili di OpenAI e Anthropic. V4-Flash è ancora più economico, a circa 0,14 dollari per milione di token in ingresso e circa 0,28 dollari per milione di token in uscita, rendendolo uno dei modelli di fascia alta più economici disponibili . Questo lo renderebbe un modello molto interessante su cui costruire applicazioni.
In termini di prestazioni, V4 rappresenta, forse non a caso, un enorme salto di qualità rispetto a R1 e sembra essere una valida alternativa a quasi tutti i più recenti modelli di IA di grandi dimensioni. Nei principali benchmark, secondo i risultati condivisi dall’azienda, DeepSeek V4-Pro compete con i principali modelli closed-source, eguagliando le prestazioni di Claude-Opus-4.6 di Anthropic, GPT-5.4 di OpenAI e Gemini-3.1 di Google. E rispetto ad altri modelli open-source, come Qwen-3.5 di Alibaba o GLM-5.1 di Z.ai, DeepSeek V4 li supera tutti in materia di programmazione, matematica e problemi STEM, rendendolo uno dei modelli open-source più potenti mai rilasciati.
DeepSeek afferma inoltre che V4-Pro si colloca ora tra i modelli open-source più potenti nei benchmark relativi alle attività di programmazione agentica e ottiene buoni risultati in altri test che misurano la capacità di risolvere problemi in più fasi. Anche la sua capacità di scrittura e la sua conoscenza del mondo sono all’avanguardia nel settore, secondo i risultati dei benchmark condivisi dall’azienda.
In un rapporto tecnico pubblicato insieme al modello, DeepSeek ha condiviso i risultati di un sondaggio interno condotto su 85 sviluppatori esperti: oltre il 90% ha incluso V4-Pro tra le proprie scelte principali per le attività di codifica.
DeepSeek afferma di aver ottimizzato V4 specificamente per i framework di agenti più diffusi, come Claude Code, OpenClaw e CodeBuddy.
2. Offre un nuovo approccio all’efficienza della memoria.
Una delle innovazioni chiave di V4 è la sua finestra di contesto estesa, ovvero la quantità di testo che il modello può elaborare contemporaneamente. Entrambe le versioni possono gestire 1 milione di token, una quantità sufficiente a contenere tutti e tre i volumi de “Il Signore degli Anelli” e “Lo Hobbit” messi insieme. L’azienda afferma che questa dimensione della finestra di contesto è ora l’impostazione predefinita in tutti i servizi DeepSeek ed è in linea con quella offerta dalle versioni all’avanguardia di modelli come Gemini e Claude.
Ma è importante sapere non solo che DeepSeek ha compiuto questo balzo in avanti, ma anche come ci è riuscita. V4 apporta modifiche architetturali significative ai modelli precedenti dell’azienda, specialmente nel meccanismo di attenzione, ovvero la caratteristica dei modelli di IA che li aiuta a comprendere ogni parte di un prompt in relazione al resto. Man mano che il testo del prompt si allunga, questi confronti diventano molto più onerosi, rendendo l’attenzione uno dei principali colli di bottiglia per i modelli a contesto lungo.
L’innovazione di DeepSeek è stata quella di rendere il modello più selettivo riguardo a ciò a cui presta attenzione. Invece di trattare tutto il testo precedente come ugualmente importante, V4 comprime le informazioni più vecchie e si concentra sulle parti che molto probabilmente sono rilevanti nel momento presente, pur mantenendo il testo circostante per intero in modo da non perdere dettagli importanti.
DeepSeek afferma che ciò riduce drasticamente il costo dell’utilizzo di contesti lunghi. In un contesto da 1 milione di token, V4-Pro utilizza solo il 27% della potenza di calcolo richiesta dal suo modello precedente, V3.2, riducendo al contempo l’utilizzo di memoria al 10%. La riduzione in V4-Flash è ancora maggiore, utilizzando solo il 10% della potenza di calcolo e il 7% della memoria. In pratica, ciò potrebbe rendere più economico lo sviluppo di strumenti che devono lavorare su enormi quantità di materiale, come un assistente di codifica AI in grado di leggere un intero codice base o un agente di ricerca in grado di analizzare un lungo archivio di documenti senza dimenticare costantemente ciò che è venuto prima.
L’interesse di DeepSeek per le finestre di contesto lunghe non è iniziato con la V4. Nell’ultimo anno e mezzo, l’azienda ha pubblicato in sordina una serie di articoli su come i modelli di IA “ricordano” le informazioni, sperimentando tecniche di compressione e matematiche per estendere ciò che i modelli di IA potrebbero realisticamente gestire.
3. Segna i primi passi su un percorso difficile che porta lontano da Nvidia.
V4 è il primo modello di DeepSeek ottimizzato per i chip cinesi, come l’Ascend di Huawei: una mossa che ha trasformato il lancio in una sorta di test per verificare se l’industria cinese dell’IA possa iniziare ad allentare la sua dipendenza dal gigante statunitense dei chip Nvidia.
Ciò era ampiamente previsto, dato che The Information aveva riportato all’inizio di questo mese che DeepSeek non aveva concesso ai produttori di chip americani come Nvidia e AMD l’accesso anticipato a V4, sebbene l’accesso pre-lancio sia comune per consentire ai produttori di chip di ottimizzare il supporto del nuovo modello prima del lancio. Invece, secondo quanto riferito, l’azienda avrebbe concesso l’accesso anticipato solo ai produttori di chip cinesi.
Venerdì, Huawei ha dichiarato che i suoi prodotti supernode Ascend, basati sulla serie Ascend 950, supporteranno DeepSeek V4. Ciò significa che le aziende e gli individui che desiderano eseguire la propria versione modificata di DeepSeek V4 potranno utilizzare facilmente i chip Huawei.
Reuters aveva già riferito che alcuni funzionari del governo cinese avevano raccomandato a DeepSeek di integrare i chip Huawei nel proprio processo di addestramento. E questa pressione rientra in un quadro più ampio della politica industriale cinese: i settori strategici sono spesso spinti, e talvolta di fatto obbligati, ad allinearsi agli obiettivi nazionali di autosufficienza. Ma c’è una particolare urgenza quando si tratta di IA. Dal 2022, i controlli sulle esportazioni statunitensi hanno tagliato fuori le aziende cinesi dai chip più potenti di Nvidia e in seguito hanno anche limitato l’accesso alle versioni ridimensionate per il mercato cinese. La risposta di Pechino è stata quella di accelerare la spinta verso uno stack di IA nazionale, dai chip ai framework software ai data center.
Secondo quanto riferito, le autorità cinesi hanno spinto i data center e i progetti di calcolo pubblico a utilizzare più chip nazionali, anche attraverso presunti divieti sui chip di fabbricazione straniera, quote di approvvigionamento e requisiti per abbinare i chip Nvidia a alternative cinesi di aziende come Huawei e Cambricon.
Tuttavia, sostituire Nvidia non è semplice come scambiare un chip con un altro. Il vantaggio di Nvidia risiede non solo nei suoi chip, ma nell’ecosistema software che gli sviluppatori hanno impiegato anni a costruire attorno ad essi. Passare ai chip Ascend di Huawei significa adattare il codice del modello, ricostruire gli strumenti e dimostrare che i sistemi costruiti attorno a quei chip sono abbastanza stabili per un uso serio.
Per essere chiari, DeepSeek non sembra essersi completamente allontanata da Nvidia. Il rapporto tecnico dell’azienda rivela che sta utilizzando chip cinesi per eseguire il modello per l’inferenza, ovvero quando qualcuno chiede al modello di completare un’attività. Ma Liu Zhiyuan, professore di informatica presso l’ e dell’Università di Tsinghua, ha dichiarato al MIT Technology Review che DeepSeek sembra aver adattato solo una parte del processo di addestramento di V4 ai chip cinesi. Il rapporto non specifica se alcune caratteristiche chiave del contesto lungo siano state adattate ai chip nazionali, quindi Liu sostiene che V4 potrebbe essere stato addestrato principalmente su chip Nvidia. Diverse fonti che hanno parlato in forma anonima, a causa della delicatezza politica di queste questioni, hanno riferito a MIT Technology Review che i chip cinesi non hanno ancora le stesse prestazioni dei chip Nvidia, ma sono più adatti all’inferenza che all’addestramento.
DeepSeek sta inoltre collegando i costi futuri di V4 a questo cambiamento hardware. L’azienda afferma che i prezzi di V4-Pro potrebbero diminuire in modo significativo dopo che i supernodi Ascend 950 di Huawei inizieranno ad essere distribuiti su larga scala nella seconda metà di quest’anno.
Se ciò funzionasse, V4 potrebbe essere un primo segnale che la Cina sta costruendo con successo un’infrastruttura di IA parallela.






