Skip to main content

Gli algoritmi di apprendimento per rinforzo hanno permesso all’IA di raggiungere risultati importanti in giochi come Go e Starcraft. Riusciranno a farlo anche con la gestione dell’economia?

di Will Douglas Heaven

La disuguaglianza di reddito è uno dei problemi generali dell’economia. Uno degli strumenti più efficaci per appianarlo che i responsabili politici hanno a disposizione è la tassazione: i governi raccolgono denaro dalle persone in base a ciò che guadagnano e lo ridistribuiscono direttamente, tramite sistemi di assistenza sociale o indirettamente, utilizzandolo per pagare progetti pubblici. Ma una tassazione eccessivamente alta può scoraggiare le persone dall’intraprendere un’attività o indurle a trovare modi per evadere le tasse, il che riduce il gettito complessivo.

Mantenere un giusto equilibrio non è facile. Gli economisti in genere si basano su ipotesi difficili da convalidare. Il comportamento economico delle persone è complesso e la raccolta di dati al riguardo non è semplice. Gli scienziati della azienda tecnologica statunitense Salesforce pensano che l’IA possa essere d’aiuto.

Dietro la guida da Richard Socher, il team ha sviluppato un sistema chiamato AI Economist che utilizza l’apprendimento per rinforzo, lo stesso tipo di tecnica alla base di AlphaGo e AlpahZero di DeepMind, per identificare politiche fiscali ottimali per un’economia simulata. 

Lo strumento è ancora relativamente semplice (non c’è modo di includere tutte le complessità del mondo reale o del comportamento umano), ma è un primo promettente passo verso la valutazione delle politiche in un modo completamente nuovo. “Sarebbe sorprendente rendere la politica fiscale meno soggetta alle pressioni politiche e più determinata dai dati”, afferma Alex Trott di Salesforce.

L’IA ha già avanzato una prima ipotesi su un tipo di azione politica che sarebbe, in termini di massimizzazione della produttività e della parità di reddito, il 16 per cento più equa di un sistema fiscale progressivo all’avanguardia studiato da economisti accademici. Il miglioramento rispetto all’attuale situazione statunitense sarebbe ancora maggiore. “Penso che sia un’idea decisamente interessante”, afferma Blake LeBaron della Brandeis University nel Massachusetts, che ha utilizzato le reti neurali per creare modelli dei mercati finanziari. 

Nella simulazione, quattro lavoratori sotto forma di intelligenza artificiale sono controllati ciascuno dai propri modelli di apprendimento per rinforzo. Interagiscono con un mondo bidimensionale, raccogliendo legno e pietra e scambiando queste risorse con gli altri o usandole per costruire case, il che permette loro di avere un profitto. I lavoratori hanno diversi livelli di abilità, il che li porta a specializzarsi. I lavoratori meno qualificati raccolgono risorse e quelli più qualificati le acquistano per costruire case. 

Alla fine di ogni anno simulato, tutti i lavoratori sono tassati con un’aliquota elaborata da un responsabile politico controllato dall’IA, che esegue il suo algoritmo di apprendimento per rinforzo. L’obiettivo del decisore politico è di aumentare la produttività e il reddito di tutti i lavoratori. Gli algoritmi convergono su un comportamento ottimale ripetendo la simulazione milioni di volte.

Entrambi i modelli di apprendimento per rinforzo iniziano da zero, senza una conoscenza preliminare di teorie economiche, e imparano ad agire attraverso prove ed errori, più o meno allo stesso modo in cui l’IA di DeepMind apprende, senza alcun input umano, a giocare a Go e StarCraft a livelli eccezionali. 

Ma sono sufficienti solo quattro lavoratori sotto forma di IA? In teoria sì, perché le semplici interazioni tra una manciata di agenti portano presto a comportamenti molto complessi (Go, per esempio, coinvolge solo due giocatori, ma raggiunge alti livelli di complessità). Tuttavia, tutti coloro che sono coinvolti nel progetto concordano sul fatto che aumentare il numero di lavoratori nella simulazione sarà essenziale se lo strumento vuole modellare scenari realistici.

Il sistema in gioco è complesso

Il raddoppio della presenza di IA è la chiave. Le reti neurali sono state utilizzate in precedenza per controllare gli agenti nelle economie simulate, ma trasformare il responsabile politico a sua volta in un’IA porta ad un modello in cui i lavoratori e il responsabile politico si adattano continuamente alle azioni reciproche. 

Questo ambiente dinamico è stato una sfida per i modelli di apprendimento del rinforzo, poiché una strategia appresa nell’ambito di una politica fiscale potrebbe non funzionare così bene in un’altra. L’IA ha trovato il modo di “ingannare”.

Per esempio, alcuni lavoratori hanno capito come diminuire le tasse, riducendo la loro produttività per poter beneficiare di una fascia fiscale più bassa. Il team di Salesforce afferma che questo “dare e avere” tra lavoratori e responsabile politico porta a una simulazione più realistica di qualsiasi altro risultato ottenuto con i modelli precedenti, in cui le politiche fiscali sono in genere fissate.

La politica fiscale elaborata da AI Economist è particolare. A differenza dei sistemi prevalenti che sono progressivi (ovvero, i redditi più alti sono tassati di più) o regressivi (i redditi più alti sono tassati di meno), la politica del sistema di Salesforce ha messo insieme aspetti di entrambi, applicando le aliquote d’imposta più alte ai ricchi e ai poveri e le più basse ai lavoratori a medio reddito.

Come molte soluzioni che l’IA escogita – ne sono un buon esempio alcune delle mosse vincenti del gioco di AlphaZero – la scelta appare controintuitiva e non qualcosa che un essere umano avrebbe potuto escogitare. Ma il suo impatto sull’economia ha portato a un divario minore tra ricchi e poveri.

Per vedere se la politica fiscale generata dall’IA avrebbe influenzato il comportamento umano in un modo simile, il team lo ha testato su più di 100 crowdworker assunti attraverso il Mechanical Turk di Amazon, a cui è stato chiesto di assumere il controllo dei lavoratori durante la simulazione. Si è scoperto che il responsabile politico gestito dagli umani si comportava nello stesso modo dell’IA, indicando – almeno in linea di principio – che AI Economist può essere usato per influenzare l’attività economica reale.

Una serie di modifiche infinite

Un altro vantaggio di una simulazione basata sull’intelligenza artificiale è che si possono modificare i parametri per esplorare diversi scenari. Per esempio, sarebbe possibile modellare l’impatto di una pandemia aggiungendo vincoli come l’allontanamento sociale e l’accesso limitato alle risorse o agendo sulla forza lavoro. “È difficile elaborare teorie fiscali ottimali basate sul passato se il futuro è del tutto diverso”, afferma Socher.

La capacità della simulazione di modellare il cambiamento è un grande vantaggio, afferma LeBaron: “È piuttosto interessante vedere come i lavoratori si adattano al regime fiscale”. In questo modo si aggira una delle grandi critiche ai sistemi fiscali esistenti: la loro rigidità. La principale riserva di LeBaron è legata al numero limitato di agenti di cui è dotato a oggi lo strumento. “Ci sono persone che sostengono che si possono ottenere risultati importanti con pochi agenti”, egli afferma. “Ma io la penso diversamente”. 

A suo parere, l’ideale sarebbe una simulazione con circa 100 lavoratori, che peraltro è anche l’obiettivo che si è dato il team di Salesforce. LeBaron crede che lo strumento potrebbe già essere usato per verificare la validità dei modelli economici esistenti: “Se fossi un politico, lo utilizzerei a tale scopo”. Se l’AI Economist non concordasse con altri modelli, allora potrebbe essere un segno che il problema è in quei modelli.

Anche David Parkes, un informatico ed economista dell’Università di Harvard che ha collaborato con il team di Salesforce, è ottimista e condivide il pensiero di LeBaron sul numero di agenti. “Aggiungendo inoltre qualche funzionalità extra il sistema diventa immediatamente utile”, egli spiega.

Doyne Farmer, un economista dell’Università di Oxford, non ne è convinto. Anche se si compiace del passaggio dell’apprendimento per rinforzo dai giochi all’economia, si domanda se sia possibile indagare sulle politiche nello stesso modo in cui AlphaZero gioca a Go. “Il mondo reale è molto più complesso di quello dei giochi” sostiene Farmer.

Il team è consapevole del fatto che ci saranno resistenze tra gli economisti. A tal fine, stanno rilasciando il loro codice e invitando altri a sperimentare i loro modelli attraverso di esso. A lungo termine, questa apertura giocherà un ruolo importante per rendere tali strumenti affidabili, afferma Socher. “Se si utilizza l’intelligenza artificiale per stabilire il sistema di tassazione”, egli conclude, “devi necessariamente spiegare perché lo fai”.

Immagine di: Tony Webster / Flickr

(rp)