Un approccio ispirato ai coni di luce di Einstein consente all’intelligenza artificiale di fare ipotesi credibili su ciò che potrebbe accadere, permettendo, per esempio, di prevedere gli effetti dei farmaci.
di Will Douglas Heaven
Nessuno conosce il futuro, ma alcune ipotesi sono molto migliori di altre. Attingendo a una descrizione fondamentale di causa ed effetto trovata nella teoria della relatività ristretta di Einstein, i ricercatori dell’Imperial College di Londra hanno escogitato un sistema per costruire ipotesi affidabili con l’aiuto dell’AI.
Possiamo fare buone ipotesi su ciò che potrebbe accadere perché abbiamo esperienza dei rapporti tra causa ed effetto, affinata dall’osservazione di come funziona il mondo e da milioni di anni di evoluzione. I computer, tuttavia, trovano difficile il ragionamento causale. I modelli di apprendimento automatico eccellono nell’individuare le correlazioni, ma non riescono a spiegare perché a un evento debba seguirne un altro.
Questo è un problema nel caso delle diagnosi basate sull’AI. Le malattie sono spesso correlate a più sintomi. Per esempio, le persone con diabete di tipo 2 sono spesso in sovrappeso e hanno difficoltà respiratorie. Ma la mancanza di respiro non è causata dal diabete e la cura di un paziente con insulina non aiuta a eliminare quel sintomo.
La comunità di intelligenza artificiale si sta rendendo conto di quanto possa essere importante il ragionamento causale per l’apprendimento automatico e ci sta lavorando con assiduità. Attualmente, i ricercatori addestrano un modello di apprendimento automatico frame per frame per individuare i modelli nelle sequenze di azioni. Si mostrano, per esempio, all’AI alcuni frame di un treno che esce da una stazione e poi gli si chiede di generare i frame successivi nella sequenza.
Le intelligenze artificiali possono fare un buon lavoro nel prevedere alcuni frame nel futuro, ma l’accuratezza diminuisce bruscamente dopo cinque o dieci frame, afferma Athanasios Vlontzos dell’Imperial College di Londra. Poiché l’intelligenza artificiale utilizza i frame precedenti per generare quello successivo, i piccoli errori commessi all’inizio, per esempio alcuni pixel difettosi, producono errori più grandi man mano che la sequenza procede.
Vlontzos e i suoi colleghi hanno cercato un approccio diverso. Invece di far imparare all’intelligenza artificiale a prevedere una sequenza specifica di frame futuri guardando milioni di clip video, le hanno fatto generare un’intera gamma di frame che erano più o meno simili ai precedenti e quindi scegliere quelli più credibili. L’intelligenza artificiale può fare ipotesi sul futuro senza dover imparare nulla sulla progressione del tempo, afferma Vlontzos.
Per fare ciò, il team ha sviluppato un algoritmo ispirato ai coni di luce, una descrizione matematica dei confini di causa ed effetto nello spaziotempo, che è stato proposto per la prima volta nella teoria della relatività ristretta di Einstein e successivamente perfezionato dal suo ex professore Hermann Minkowski. I coni di luce emergono in fisica perché la velocità della luce è costante. Mostrano i limiti in espansione di un raggio di luce – e di tutto il resto – come se fosse emanato da un evento iniziale, per esempio un’esplosione.
Si prenda un foglio di carta, si segni un evento al suo interno con un punto e si disegni un cerchio intorno all’evento. La distanza tra il punto e il bordo del cerchio è la distanza percorsa dalla luce in un periodo di tempo, diciamo un secondo. Poiché niente, nemmeno le informazioni, possono viaggiare più velocemente della luce, il bordo di questo cerchio è un confine rigido sull’influenza causale dell’evento originale. In linea di principio, qualsiasi cosa all’interno del cerchio avrebbe potuto essere influenzata dall’evento; ma nulla all’esterno.
Dopo due secondi, la luce ha percorso il doppio della distanza e la dimensione del cerchio è raddoppiata: ora ci sono molti più futuri possibili per quell’evento originale. Si immagini questi cerchi sempre più grandi che si sollevano secondo dopo secondo dal foglio di carta e si ottiene un cono capovolto con l’evento originale sulla sua punta. Questo è un cono di luce. Un’immagine speculare del cono può anche estendersi all’indietro, dietro il foglio di carta, che conterrà tutti i possibili passati che avrebbero potuto portare all’evento originale.
Vlontzos ei suoi colleghi hanno utilizzato questo concetto per limitare i frame futuri che un’AI potrebbe scegliere. Hanno testato l’idea su due set di dati: Moving MNIST, che consiste in brevi video clip di cifre scritte a mano che si muovono su uno schermo, e il database di video KTH, che contiene clip di persone che camminano o muovono le braccia. In entrambi i casi, hanno addestrato l’AI a generare frame simili a quelli del set di dati. Ma, la differenza importante è che i frame nel set di dati di addestramento non sono stati visualizzati in sequenza e l’algoritmo non stava imparando come completare una serie.
Hanno quindi chiesto all’AI di scegliere quale dei nuovi frame aveva più probabilità di seguirne un altro. Per fare ciò, l’AI ha raggruppato i frame generati in base alla somiglianza e quindi ha utilizzato l’algoritmo del cono di luce per disegnare un confine attorno a quelli che avrebbero potuto essere correlati in modo causale al frame dato. Nonostante non sia stato addestrata a continuare una sequenza, l’AI è in grado di fare buone ipotesi sui frame successivi.
Se le si presenta un frame in cui una persona con i capelli corti che indossa una maglietta sta camminando, l’AI rifiuterà frame successivi che mostrano una persona con i capelli lunghi o senza maglietta, dice Vlontzos. Il lavoro è nelle fasi finali della revisione per la presentazione a NeurIPS, un’importante conferenza sull’apprendimento automatico.
Un vantaggio dell’approccio è che dovrebbe funzionare con diversi tipi di apprendimento automatico, purché il modello possa generare nuovi frame simili a quelli del set di addestramento. Potrebbe anche essere utilizzato per migliorare l’accuratezza delle AI esistenti addestrate sulle sequenze video.
Per testare l’approccio, il team ha fatto espandere i coni a una velocità fissa, anche se nella realtà questo tasso varierà. Per esempio, una palla su un campo di calcio avrà più posizioni possibili in futuro rispetto a una palla che viaggia lungo i binari. Ciò significa che sarebbe necessario un cono che si espandesse a un ritmo più veloce per il calcio.
L’elaborazione di queste velocità implica l’approfondimento della termodinamica, il che non è affatto semplice. Per ora, il team prevede di impostare manualmente il diametro dei coni. Ma guardando il video di una partita di calcio, per esempio, l’AI potrebbe imparare quanto velocemente si muovono gli oggetti, consentendole di impostare il diametro del cono stesso. Un’intelligenza artificiale potrebbe anche apprendere al volo, osservando la velocità con cui un sistema reale è cambiato e regolando le dimensioni del cono per andare incontro ai mutamenti.
Prevedere il futuro è importante per molte applicazioni. I veicoli autonomi devono essere in grado di anticipare se un bambino sta per correre sulla strada o se un ciclista indeciso rappresenta un pericolo. I robot che devono interagire con oggetti fisici devono essere in grado di valutare il comportamento di determinati oggetti quando vengono spostati. I sistemi predittivi in generale saranno più accurati se possono ragionare su causa ed effetto piuttosto che solo sulla correlazione.
Ma Vlontzos e i suoi colleghi sono particolarmente interessati al campo medico. Un’intelligenza artificiale potrebbe essere utilizzata per simulare come un paziente potrebbe rispondere a una terapia, per esempio, per capire come modularla con successo. “Esaminando le possibilità, si può vedere come un farmaco permetterà di affrontare una malattia”, afferma Vlontzos. L’approccio potrebbe essere valido anche con le immagini mediche. Data una risonanza magnetica di un cervello, un’intelligenza artificiale potrebbe identificare i probabili modi in cui una malattia potrebbe progredire.
“È affascinante vedere il possibile sviluppo nel settore dell’AI di idee riprese dalla fisica fondamentale”, afferma Ciaran Lee, un ricercatore che lavora sull’inferenza causale a Spotify e all’University College di Londra. “Una comprensione della causalità è davvero importante se si vogliono intraprendere azioni o decisioni nel mondo reale”, egli conclude.
Immagine: Étienne-Jules Marey
(rp)