La combinazione dell’elaborazione del linguaggio naturale e dell’apprendimento per rinforzo in un gioco di avventura basato sul testo mostra alle macchine il modo di utilizzare il linguaggio per raggiungere un obiettivo.
di Will Douglas Heaven
Un’intelligenza artificiale, che completa le missioni in un gioco di avventura basato su testo parlando con i personaggi, ha imparato non solo a fare quanto le viene chiesto, ma anche a convincere gli altri a fare delle azioni. Il sistema è un passo avanti verso la produzione di macchine in grado di utilizzare il linguaggio per raggiungere i propri obiettivi.
I modelli linguistici come GPT-3 sono brillanti nell’imitare frasi scritte da persone e creare storie, falsi blog e post su Reddit. Ma non ha molto senso questa prolifica produzione fine a se stessa. Quando le persone usano il linguaggio, in genere è per convincere, scambiare idee, far ridere o piangere, a volte manipolare gli altri.
Per costruire un’AI che usasse le parole per raggiungere un obiettivo, i ricercatori del Georgia Institute of Technology di Atlanta e Facebook AI Research hanno combinato tecniche di elaborazione del linguaggio naturale e apprendimento di rinforzo, in cui i modelli di apprendimento automatico imparano come comportarsi per ottenere obiettivi prefissati. Entrambi i campi di ricerca hanno registrato enormi progressi negli ultimi anni, ma c’è stata poca collaborazione fattiva tra i due.
Per testare il loro approccio, i ricercatori hanno addestrato il loro sistema in un gioco multiplayer basato su testo chiamato LIGHT, sviluppato da Facebook lo scorso anno per studiare la comunicazione tra giocatori umani e AI. Il gioco è ambientato in un mondo fantasy pieno di migliaia di oggetti, personaggi e luoghi in crowdsourcing con cui si interagisce tramite testo sullo schermo. I giocatori (umani o computer) possono digitare comandi come “abbraccia il mago”, “colpisci il drago” o “sposta il cappello” e parlare con i personaggi controllati dal chatbot.
Per fornire alla loro intelligenza artificiale degli obiettivi, i ricercatori hanno aggiunto circa 7.500 missioni in crowdsourcing, non incluse nella versione originale di LIGHT. Infine, hanno anche creato un grafico della conoscenza (un database di relazioni soggetto-verbo-oggetto) che ha fornito all’AI informazioni di buon senso sul mondo del gioco e sulle relazioni tra i suoi personaggi. Il gioco prevede azioni del tipo “Vai in montagna” per completare le missioni (per esempio, “Accumula il più grande tesoro mai ottenuto da un drago”).
I ricercatori hanno addestrato l’AI a completare le missioni usando unicamente il linguaggio. Per eseguire azioni, si può digitare il comando per quell’azione o ottenere lo stesso scopo parlando con altri personaggi. Per esempio, se l’AI avesse bisogno di una spada, potrebbe scegliere tra rubarne una o convincere un altro personaggio a consegnargliela.
Per ora, il sistema è poco più di un giocattolo. E i suoi modi possono essere bruschi: a un certo punto, avendo bisogno di un secchio, dice brutalmente: “Dammi quel secchio o ti darò in pasto al mio gatto!” Ma mescolare la PNL con l’apprendimento per rinforzo è una strategia promettente che potrebbe portare non solo a chatbot in grado di discutere e persuadere, ma anche di comprendere realmente come funziona il nostro mondo.
Immagine di: Facebook
(rp)