
SIMA 2, in grado di capire come risolvere i problemi all’interno dei mondi virtuali, potrebbe portare alla creazione di agenti più generici e robot migliori.
Google DeepMind ha creato un nuovo agente per videogiochi chiamato SIMA 2 in grado di navigare e risolvere problemi in un’ampia gamma di mondi virtuali 3D. L’azienda sostiene che si tratti di un grande passo avanti verso agenti più generici e robot migliori nel mondo reale.
Google DeepMind ha presentato per la prima volta SIMA (acronimo di “scalable instructable multiworld agent”) lo scorso anno. Ma SIMA 2 è stato costruito sulla base di Gemini, il modello linguistico di punta dell’azienda, che conferisce all’agente un enorme potenziamento delle capacità.
I ricercatori sostengono che SIMA 2 è in grado di svolgere una serie di compiti più complessi all’interno dei mondi virtuali, capire come risolvere determinate sfide da solo e chattare con i suoi utenti. Può anche migliorare se stesso affrontando più volte compiti più difficili e imparando attraverso tentativi ed errori.
“I giochi sono stati per molto tempo una forza trainante della ricerca sugli agenti”, ha dichiarato Joe Marino, ricercatore scientifico di Google DeepMind, in una conferenza stampa questa settimana. Ha osservato che anche un’azione semplice in un gioco, come accendere una lanterna, può comportare più passaggi: “È una serie di compiti davvero complessi che è necessario risolvere per progredire”. L’obiettivo finale è quello di sviluppare agenti di nuova generazione in grado di seguire le istruzioni e svolgere compiti aperti in ambienti più complessi rispetto a un browser web. A lungo termine, Google DeepMind vuole utilizzare tali agenti per guidare robot nel mondo reale. Marino ha affermato che le competenze acquisite da SIMA 2, come la navigazione in un ambiente, l’uso di strumenti e la collaborazione con gli esseri umani per risolvere i problemi, sono elementi fondamentali per i futuri robot di compagnia.
A differenza dei precedenti lavori sugli agenti di gioco come AlphaZero, che ha battuto un grande maestro di Go nel 2016, o AlphaStar, che ha battuto il 99,8% dei giocatori umani classificati nel videogioco StarCraft 2 nel 2019, l’idea alla base di SIMA è quella di addestrare un agente a giocare a un gioco aperto senza obiettivi prestabiliti. L’agente impara invece a eseguire le istruzioni che gli vengono date dalle persone.
Gli esseri umani controllano SIMA 2 tramite chat di testo, parlando ad alta voce o disegnando sullo schermo del gioco. L’agente acquisisce i pixel di un videogioco fotogramma per fotogramma e capisce quali azioni deve intraprendere per svolgere i suoi compiti.
Come il suo predecessore, SIMA 2 è stato addestrato su filmati di esseri umani che giocavano a otto videogiochi commerciali, tra cui No Man’s Sky e Goat Simulator 3, oltre a tre mondi virtuali creati dall’azienda. L’agente ha imparato ad abbinare i comandi della tastiera e del mouse alle azioni.
Collegato a Gemini, secondo i ricercatori, SIMA 2 è molto più bravo a seguire le istruzioni (facendo domande e fornendo aggiornamenti man mano che procede) e a capire da solo come eseguire determinati compiti più complessi.
Google DeepMind ha testato l’agente all’interno di ambienti che non aveva mai visto prima. In una serie di esperimenti, i ricercatori hanno chiesto a Genie 3, l’ultima versione del modello mondiale dell’azienda, di produrre ambienti da zero e vi hanno inserito SIMA 2. Hanno scoperto che l’agente era in grado di navigare ed eseguire le istruzioni in quegli ambienti.
I ricercatori hanno anche utilizzato Gemini per generare nuovi compiti per SIMA 2. Se l’agente falliva, Gemini generava inizialmente dei suggerimenti che SIMA 2 prendeva in considerazione quando riprovava. Ripetere un compito più volte in questo modo ha spesso permesso a SIMA 2 di migliorare attraverso tentativi ed errori fino a quando non ci riusciva, ha detto Marino.
Git gud
SIMA 2 è ancora un esperimento. L’agente ha difficoltà con compiti complessi che richiedono più passaggi e più tempo per essere completati. Inoltre, ricorda solo le sue interazioni più recenti (per rendere SIMA 2 più reattivo, il team ha ridotto la sua memoria a lungo termine). Inoltre, è ancora lontano dall’essere bravo come le persone nell’uso del mouse e della tastiera per interagire con un mondo virtuale.
Julian Togelius, ricercatore di intelligenza artificiale alla New York University che si occupa di creatività e videogiochi, ritiene che sia un risultato interessante. I precedenti tentativi di addestrare un singolo sistema a giocare a più giochi non hanno avuto molto successo, afferma. Questo perché addestrare modelli a controllare più giochi semplicemente guardando lo schermo non è facile: “Giocare in tempo reale solo con input visivi è una modalità difficile”, afferma.
In particolare, Togelius cita GATO, un precedente sistema di Google DeepMind che, nonostante fosse stato molto pubblicizzato all’epoca, non era in grado di trasferire le competenze in un numero significativo di ambienti virtuali.
Tuttavia, è aperto alla possibilità che SIMA 2 possa portare a robot migliori. “Il mondo reale è sia più difficile che più facile dei videogiochi”, afferma. È più difficile perché non basta premere A per aprire una porta. Allo stesso tempo, un robot nel mondo reale saprà esattamente cosa può e non può fare il suo corpo in qualsiasi momento. Questo non è il caso dei videogiochi, dove le regole all’interno di ogni mondo virtuale possono differire.
Altri sono più scettici. Matthew Guzdial, ricercatore di intelligenza artificiale presso l’Università di Alberta, non è troppo sorpreso dal fatto che SIMA 2 sia in grado di giocare a molti videogiochi diversi. Egli osserva che la maggior parte dei giochi ha comandi da tastiera e mouse molto simili: imparandone uno, li impari tutti. “Se gli si presentasse un gioco con comandi strani, non credo che sarebbe in grado di funzionare bene”, afferma.
Guzdial si chiede anche quanto di ciò che SIMA 2 ha imparato possa essere realmente trasferito ai robot. “È molto più difficile comprendere le immagini delle telecamere nel mondo reale rispetto ai giochi, che sono progettati con immagini facilmente interpretabili dai giocatori umani”, afferma.
Tuttavia, Marino e i suoi colleghi sperano di continuare il loro lavoro con Genie 3 per consentire all’agente di migliorare all’interno di una sorta di dojo di allenamento virtuale senza fine, dove Genie genera mondi in cui SIMA può imparare attraverso tentativi ed errori guidati dal feedback di Gemini. “Abbiamo solo sfiorato la superficie di ciò che è possibile”, ha affermato durante la conferenza stampa.




