DeepMind vuole insegnare alle IA come giocare ad un gioco di carte più complesso del Go
Il gioco di carte Hanabi si basa sulla Teoria della Mente (ToM) e richiede una capacità di ragionamento superiore a quella necessaria per giocare a Go o agli scacchi. Non è un caso che i ricercatori della DeepMind siano interessati.
di Karen Hao 07-02-19
Chiunque abbia mai giocato al gioco di carte chiamato Hanabi sa che è unico nel suo genere. È un gioco cooperativo in cui i giocatori possono vedere le carte degli avversari, ma non le proprie.

Per vincere il gioco, ciascun giocatore deve dare agli altri indizi sulle carte che hanno in mano perchè possano organizzare le in un determinato ordine. ciascuna partita dura per un numero limitato di mani. Si tratta di un intenso esercizio di strategia, deduzione e collaborazione che i ricercatori della Google Brain e della DeepMind ritengono perfetto per l'evoluzione delle IA.

In un recente studio, i ricercatori spiegano che a differenza di altri giochi a cui le IA hanno imparato a giocare, come gli scacchi, il Go o il poker, l'Hanabi richiede un'applicazione della Teoria della Mente ed una capacità di ragionamento superiori. La ToM si occupa di comprendere lo stato mentale dell'altro, in particolare, di capire che l'altro potrebbe essere diverso da sé. Si tratta di una capacità fondamentale che permette agli esseri umani di operare efficientemente nel mondo, solitamente acquisita in giovane età.

Le informazioni nel gioco dell'Hanabi sono limitate sia dal numero di suggerimenti consentiti per ogni partita che da quanto può essere comunicato in ciascun suggerimento. Per vincere al gioco dunque, l'IA dovrà imparare a intuire informazioni implicite nelle azioni degli altri giocatori, una frontiera completamente nuova.
Il programma dovrà inoltre imparare a formulare i propri suggerimenti e le proprie azioni di modo da comunicare il maggior numero di informazioni possibili per favorire il successo degli altri giocatori.

Secondo i ricercatori, una IA che dovesse riuscire a orientarsi in un ambiente caratterizzato da informazioni di natura imperfetta, si rivelerà più capace che mai di collaborare in maniera efficiente con gli esseri umani.
Queste novità richiederanno nuove evoluzioni tra gli algoritmi, capaci di creare collegamenti tra sottoinsiemi delle IA, come l'apprendimento per rinforzo, la teoria dei giochi e la Emergent Communication, lo studio di come emerge la comunicazione tra IA in condizioni di collaborazione.

Per confermare questa ipotesi, la squadra della Google ha testato algoritmi di apprendimento per rinforzo attualmente all'avanguardia e li hanno trovati deludenti. Hanno quindi reso pubblico un gioco dell'Hanabi open-source per promuovere nuovi approfondimenti nella comunità scientifica.

“In qualità di ricercatore, sono affascinato dalla capacità delle IA di imparare a comunicare e cooperare tra loro, nonché con gli esseri umani,” spiega Jakob Foerster, uno degli autori dello studio. “L'Hanabi rappresenta una nuova opportunità per questo campo di studio.”