Conversazioni esclusive che ci portano dietro le quinte di un fenomeno culturale.
Quando OpenAI ha lanciato ChatGPT, con zero fanfare, alla fine del novembre 2022, l’azienda di intelligenza artificiale di San Francisco non aveva molte aspettative. Di certo, nessuno all’interno di OpenAI era preparato a un mega successo virale. Da allora, l’azienda sta cercando di recuperare e di capitalizzare il suo successo.
È stata considerata internamente come una “anteprima di ricerca”, dice Sandhini Agarwal, che si occupa di policy presso OpenAI: un assaggio di una versione più rifinita di una tecnologia vecchia di due anni e, cosa più importante, un tentativo di limare alcuni dei suoi difetti raccogliendo feedback dal pubblico. “Non volevamo che si trattasse di un grande progresso fondamentale”, dice Liam Fedus, uno scienziato di OpenAI che ha lavorato a ChatGPT.
Per conoscere la storia interna del chatbot – come è stato realizzato, come OpenAI lo ha aggiornato dal momento del rilascio e come i suoi creatori si sentono a proposito del suo successo – ho parlato con quattro persone che hanno contribuito a costruire quella che è diventata una delle applicazioni internet più popolari di sempre. Oltre ad Agarwal e Fedus, ho parlato con John Schulman, cofondatore di OpenAI, e Jan Leike, leader del team di allineamento di OpenAI, che lavora sul problema di far sì che l’IA faccia ciò che gli utenti vogliono che faccia (e niente di più).
Ciò che mi ha colpito è stata la sensazione che OpenAI sia ancora confusa dal successo della sua anteprima di ricerca, ma che abbia colto l’opportunità di spingere questa tecnologia in avanti, osservando come milioni di persone la utilizzano e cercando di risolvere i problemi peggiori man mano che si presentano.
Da novembre, OpenAI ha già aggiornato ChatGPT diverse volte. I ricercatori utilizzano una tecnica chiamata “adversarial training” per impedire a ChatGPT di essere ingannato dagli utenti e di comportarsi male (il cosiddetto jailbreak). Questo lavoro mette diversi chatbot l’uno contro l’altro: un chatbot interpreta l’avversario e attacca un altro chatbot generando testo per costringerlo a trasgredire i suoi vincoli abituali e a produrre risposte indesiderate. Gli attacchi riusciti vengono aggiunti ai dati di formazione di ChatGPT, nella speranza che impari a ignorarli.
OpenAI ha anche siglato un accordo multimiliardario con Microsoft e ha annunciato un’alleanza con Bain, una società di consulenza manageriale globale, che intende utilizzare i modelli di IA generativa di OpenAI nelle campagne di marketing per i suoi clienti, tra cui Coca-Cola. Al di fuori di OpenAI, il fermento per ChatGPT ha scatenato un’altra corsa all’oro intorno ai modelli linguistici di grandi dimensioni, con aziende e investitori di tutto il mondo che si sono messi in gioco.
In tre mesi scarsi c’è stato molto clamore. Da dove nasce ChatGPT? Quali passi ha fatto OpenAI per assicurarsi che fosse pronto per il rilascio? E dove andranno le prossime mosse?
Quanto segue è stato modificato per ragioni di lunghezza e chiarezza.
Jan Leike: Onestamente è stato travolgente. Siamo stati sorpresi e abbiamo cercato di recuperare.
John Schulman: Controllavo spesso Twitter nei giorni successivi all’uscita, e c’è stato un periodo pazzesco in cui il feed si riempiva di schermate di ChatGPT. Mi aspettavo che sarebbe stato intuitivo per le persone e che avrebbe ottenuto un seguito, ma non mi aspettavo che avrebbe raggiunto questo livello di popolarità mainstream.
Sandhini Agarwal: Credo che sia stata una sorpresa per tutti noi il fatto che le persone abbiano iniziato a usarlo. Lavoriamo così tanto su questi modelli che a volte dimentichiamo quanto possano essere sorprendenti per il mondo esterno.
Liam Fedus: Siamo stati decisamente sorpresi di come sia stato accolto bene. Ci sono stati così tanti tentativi precedenti di chatbot di uso generale che sapevo che le probabilità di successo erano contro di noi. Tuttavia, la nostra beta privata ci ha dato la certezza di avere qualcosa che poteva piacere alle persone.
Jan Leike: Mi piacerebbe capire meglio cosa sta guidando tutto questo, cosa sta guidando la viralità. Onestamente, non lo capiamo. Non lo sappiamo.
Parte delle perplessità del team deriva dal fatto che la maggior parte della tecnologia di ChatGPT non è nuova. ChatGPT è una versione perfezionata di GPT-3.5, una famiglia di modelli linguistici di grandi dimensioni che OpenAI ha rilasciato mesi prima del chatbot. GPT-3.5 è a sua volta una versione aggiornata di GPT-3, apparso nel 2020. L’azienda mette a disposizione questi modelli sul proprio sito web come interfacce di programmazione delle applicazioni, o API, che consentono ad altri sviluppatori di software di inserire facilmente i modelli nel proprio codice. OpenAI ha anche rilasciato una precedente versione perfezionata di GPT-3.5, chiamata InstructGPT, nel gennaio 2022. Ma nessuna di queste versioni precedenti della tecnologia è stata presentata al pubblico.