Skip to main content
Photo Illustration by Sarah Rogers / MITTR | Photo Getty

OpenAI ha appena rilasciato o3-mini, un modello di ragionamento più veloce, più economico e più preciso del suo predecessore.

Giovedì scorso Microsoft ha annunciato l’estensione del modello di ragionamento o1 di OpenAI agli utenti di Copilot e ora OpenAI sta rilasciando un nuovo modello di ragionamento, o3-mini, a chi utilizza la versione gratuita di ChatGPT. Per la prima volta la maggior parte delle persone avrà accesso a uno dei modelli di ragionamento di OpenAI che in precedenza erano riservati ai pacchetti Pro e Plus a pagamento.

I modelli di ragionamento utilizzano una tecnica di “catena di pensiero” per generare le risposte, lavorando essenzialmente attraverso un problema presentato al modello passo dopo passo. Con questo metodo, il modello può individuare gli errori nel suo processo e correggerli prima di dare una risposta. In genere, ciò si traduce in risposte più complete e accurate, ma fa sì che i modelli si fermino prima di rispondere, causando a volte lunghi tempi di attesa. OpenAI sostiene che o3-mini risponde il 24% più velocemente di o1-mini.

Questi tipi di modelli sono più efficaci nella risoluzione di problemi complessi, quindi se avete problemi di matematica di livello dottorale da risolvere, potete provarli. In alternativa, se avete avuto problemi a far rispondere correttamente i modelli precedenti alle richieste più avanzate, potreste provare questo nuovo modello di ragionamento. Per provare o3-mini, basta selezionare “Ragiona” quando si avvia un nuovo prompt su ChatGPT.

Anche se i modelli di ragionamento possiedono nuove capacità, hanno un costo. Il modello o1-mini di OpenAI è 20 volte più costoso da gestire rispetto al modello equivalente non ragionante, GPT-4o mini. L’azienda afferma che il suo nuovo modello, o3-mini, costa il 63% in meno di o1-mini per token di input. Tuttavia, con un costo di 1,10 dollari per milione di token di input, il suo funzionamento è ancora sette volte più costoso di GPT-4o mini.

Questo nuovo modello arriva subito dopo il rilascio di DeepSeek che ha scosso il mondo dell’intelligenza artificiale meno di due settimane fa. Il nuovo modello di DeepSeek ha prestazioni pari a quelle dei migliori modelli OpenAI, ma l’azienda cinese sostiene che l’addestramento è costato circa 6 milioni di dollari, contro il costo stimato di oltre 100 milioni di dollari per l’addestramento del GPT-4 di OpenAI. (Vale la pena notare che molte persone stanno contestando questa affermazione).

Inoltre, il modello di ragionamento di DeepSeek costa 0,55 dollari per milione di token di input, la metà del prezzo di o3-mini, quindi OpenAI ha ancora molta strada da fare per ridurre i suoi costi. Si stima che i modelli di ragionamento abbiano anche costi energetici molto più elevati rispetto ad altri tipi, dato il maggior numero di calcoli che richiedono per produrre una risposta.

Questa nuova ondata di modelli di ragionamento presenta anche nuove sfide per la sicurezza. OpenAI ha utilizzato una tecnica chiamata allineamento deliberativo per addestrare i suoi modelli della serie o, facendo in modo che facessero riferimento alle politiche interne di OpenAI in ogni fase del ragionamento per assicurarsi che non ignorassero alcuna regola.

Ma l’azienda ha scoperto che o3-mini, come il modello o1, è significativamente migliore dei modelli non ragionanti nelle operazioni di jailbreak e nelle “valutazioni di sicurezza impegnative”: in sostanza, è molto più difficile controllare un modello ragionante, date le sue capacità avanzate. o3-mini è il primo modello a ottenere un punteggio di “rischio medio” per l’autonomia del modello, una valutazione assegnata perché è migliore dei modelli precedenti in compiti specifici di codifica, il che indica un “maggiore potenziale di auto-miglioramento e di accelerazione della ricerca sull’IA”, secondo OpenAI. Detto questo, il modello non è ancora all’altezza della ricerca nel mondo reale. Se fosse migliore in questo campo, sarebbe classificato come ad alto rischio e OpenAI ne limiterebbe il rilascio.