Ecco cosa bisogna fare per rendere gli assistenti AI veramente utili.
Olivier Godement, responsabile dei prodotti per la piattaforma OpenAI, e Romain Huet, responsabile dell’esperienza degli sviluppatori, stanno facendo il giro del mondo. La scorsa settimana ho incontrato i due a Londra prima del DevDay, la conferenza annuale dell’azienda dedicata agli sviluppatori. Il DevDay di Londra è il primo per l’azienda al di fuori di San Francisco. Godement e Huet si dirigeranno poi a Singapore.
Sono state settimane intense per l’azienda. A Londra, OpenAI ha annunciato gli aggiornamenti della sua nuova piattaforma Realtime API, che consente agli sviluppatori di inserire funzioni vocali nelle loro applicazioni. L’azienda sta introducendo nuove voci e una funzione che consente agli sviluppatori di generare messaggi, consentendo loro di creare più rapidamente applicazioni e assistenti vocali più utili. Nel frattempo, per i consumatori, OpenAI ha annunciato il lancio della ricerca ChatGPT, che consente agli utenti di effettuare ricerche su Internet utilizzando il chatbot. Ecco un articolo per saperne odi più.
Entrambi gli sviluppi aprono la strada alla prossima grande novità dell’IA: gli agenti. Si tratta di assistenti AI in grado di completare catene complesse di compiti, come la prenotazione di voli. (Qui potete leggere la mia spiegazione sugli agenti).
“In avanti di qualche anno: ogni essere umano sulla Terra, ogni azienda, ha un agente. Quell’agente vi conosce molto bene. Conosce le vostre preferenze”, dice Godement. L’agente avrà accesso alle vostre e-mail, app e calendari e agirà come un capo del personale, interagendo con ciascuno di questi strumenti e lavorando anche su problemi a lungo termine, come la stesura di un articolo su un particolare argomento, spiega Godement.
La strategia di OpenAI consiste sia nel costruire agenti in proprio sia nel consentire agli sviluppatori di utilizzare il suo software per creare i propri agenti, afferma Godement. La voce avrà un ruolo importante nell’aspetto e nella percezione degli agenti.
“Al momento la maggior parte delle app è basata sulla chat… il che è bello, ma non è adatto a tutti i casi d’uso. Ci sono casi d’uso in cui non si scrive, non si guarda nemmeno lo schermo, e quindi la voce è una modalità molto più adatta”, afferma.
Ma ci sono due grandi ostacoli che devono essere superati prima che gli agenti possano diventare una realtà, dice Godement.
Il primo è il ragionamento. Per costruire agenti di intelligenza artificiale dobbiamo essere in grado di fidarci della loro capacità di portare a termine compiti complessi e di fare le cose giuste, dice Huet. È qui che entra in gioco la funzione “ragionamento” di OpenAI. Introdotta nel modello o1 di OpenAI il mese scorso, utilizza l’apprendimento per rinforzo per insegnare al modello come elaborare le informazioni utilizzando una “catena di pensiero”. Dare al modello più tempo per generare risposte gli permette di riconoscere e correggere gli errori, scomporre i problemi in altri più piccoli e provare approcci diversi per rispondere alle domande, spiega Godement.
Ma le affermazioni di OpenAI sul ragionamento dovrebbero essere prese con un pizzico di sale, sostiene Chirag Shah, professore di informatica all’Università di Washington. I modelli linguistici di grandi dimensioni non mostrano un vero ragionamento. È più probabile che abbiano tratto ciò che sembra logica da qualcosa che hanno visto nei loro dati di addestramento.
“Questi modelli a volte sembrano essere davvero straordinari nel ragionamento, ma è come se fossero davvero bravi a fingere, e basta un po’ di manipolazione per romperli”, dice.
Godement ammette che c’è ancora molto lavoro da fare. A breve termine, i modelli di intelligenza artificiale come o1 devono essere molto più affidabili, veloci ed economici. A lungo termine, l’azienda deve applicare la tecnica della catena del pensiero a un numero maggiore di casi d’uso. OpenAI si è concentrata su scienza, codifica e matematica. Ora vuole rivolgersi ad altri campi, come la legge, la contabilità e l’economia.
Al secondo posto della lista delle cose da fare c’è la capacità di collegare strumenti diversi, dice Godement. Le capacità di un modello di intelligenza artificiale saranno limitate se dovrà basarsi solo sui dati di addestramento. Deve essere in grado di navigare sul web e cercare informazioni aggiornate. La ricerca ChatGPT è un modo potente con cui i nuovi strumenti di OpenAI possono farlo.
Questi strumenti devono essere in grado non solo di recuperare informazioni, ma anche di compiere azioni nel mondo reale. Il concorrente Anthropic ha annunciato una nuova funzione per cui il suo chatbot Claude può “usare” un computer interagendo con la sua interfaccia per fare clic su qualcosa, ad esempio. Si tratta di una caratteristica importante per gli agenti, se devono essere in grado di eseguire operazioni come la prenotazione di voli. Godement afferma che o1 può “più o meno” utilizzare gli strumenti, anche se non in modo molto affidabile, e che la ricerca sull’uso degli strumenti è uno “sviluppo promettente”.
Nel prossimo anno, Godemont prevede una crescita dell’adozione dell’IA per l’assistenza ai clienti e per altri compiti basati su assistenti. Tuttavia, afferma che può essere difficile prevedere come le persone adotteranno e utilizzeranno la tecnologia di OpenAI.
“Francamente, guardando indietro ogni anno, sono sorpreso dai casi d’uso che sono emersi e che non avevo previsto”, afferma. “Mi aspetto che ci siano parecchie sorprese che nessuno di noi poteva prevedere”.