L’intelligenza artificiale sta aiutando i chimici a svelare i misteri sulle origini della vita e a rilevarne i segni in altri mondi.
Come nasce la vita è una delle domande più grandi e difficili della scienza. Tutto ciò che sappiamo è che qualcosa è accaduto sulla Terra più di 3,5 miliardi di anni fa, e potrebbe essere accaduto anche su molti altri mondi dell’universo.
Ma non sappiamo quale sia il trucco. In qualche modo, un insieme di sostanze chimiche non viventi come l’acqua e il metano deve essersi combinata e auto-organizzata, diventando sempre più complessa e coordinata, fino a dare origine a una cellula vivente.
Una delle maggiori difficoltà è la complessità del problema: anche i più semplici batteri conosciuti hanno più di 100 geni e contengono centinaia di tipi di molecole, che interagiscono furiosamente in una danza microscopica. Anche l’ambiente della Terra primordiale deve essere stato complicato: un numero enorme di sostanze chimiche diverse, dai metalli e minerali all’acqua e ai gas, tutte sballottate dai venti e dalle eruzioni vulcaniche.
“Lo spazio dei parametri sperimentali è quasi infinito”, afferma Wilhelm Huck, chimico della Radboud University di Nijmegen, nei Paesi Bassi.
Ora alcuni ricercatori stanno tentando un nuovo approccio: sfruttare l’intelligenza artificiale per individuare le condizioni vincenti. In particolare, diversi gruppi hanno iniziato a utilizzare strumenti di apprendimento automatico in grado di identificare modelli in serie di dati troppo grandi e disordinati per essere compresi dal cervello umano.
La speranza è che questi strumenti aiutino i ricercatori a realizzare in pochi anni ciò che altrimenti richiederebbe decenni. Indicando la strada per i processi più rapidi e robusti per generare la complessità, potrebbero aiutarci a elaborare una teoria universale delle origini della vita, applicabile non solo sulla Terra ma su qualsiasi altro mondo.
È ancora presto, ma ci sono già stati alcuni progressi significativi.
Creare la vita da zero
Il problema delle origini della vita riguarda almeno in parte la chimica: quale miscela di sostanze chimiche, in quali condizioni, è necessaria per la formazione della vita? “La chimica risponderà a questa domanda, una delle domande più profonde dell’umanità”, afferma Leroy “Lee” Cronin, chimico dell’Università di Glasgow nel Regno Unito.
Lo studio delle origini della vita è stato avviato da un esperimento pubblicato nel 1953. Stanley Miller, uno studente laureato sotto la supervisione del chimico Harold Urey, mescolò acqua e tre gas in matracci di vetro, che vennero riscaldati e sottoposti a scosse elettriche che imitavano i fulmini che si supponeva colpissero regolarmente la giovane Terra. Nel giro di pochi giorni, questo sistema ha prodotto la glicina, l’amminoacido più semplice e uno dei mattoni delle proteine.
Sebbene l’esperimento di Miller non abbia prodotto la vita o qualcosa di simile, è diventato iconico perché era relativamente privo di supervisione: Miller ha semplicemente impostato l’esperimento e l’ha lasciato funzionare. Questo doveva imitare le condizioni della Terra giovane, dove non c’erano chimici sintetisti a guidare le reazioni chimiche verso il risultato “corretto”. Tuttavia, il presunto realismo dell’esperimento era anche un problema: produceva così tante sostanze chimiche che identificarle tutte e capire come si formassero era quasi impossibile.
Molti esperimenti successivi di chimica “prebiotica” sono stati controllati con maggiore attenzione. Sono riusciti a produrre molti altri aminoacidi, zuccheri e altre sostanze chimiche della vita. Tuttavia, non è chiaro se queste reazioni meticolosamente curate avrebbero avuto luogo senza l’intervento umano, e quindi potrebbero non dirci nulla sulla Terra primordiale. I ricercatori vogliono tornare all’esperimento di Miller, trovando modi migliori per esplorare ciò che accade in miscele complesse non controllate.
È qui che può intervenire l’apprendimento automatico. La tecnologia è già stata applicata a problemi esistenti in biologia: in particolare, il sistema AlphaFold di Google DeepMind ha previsto con successo le forme tridimensionali ripiegate di migliaia di proteine. Per rendere possibile questo risultato, i suoi creatori hanno prima addestrato AlphaFold sulle strutture note di molte proteine. Una volta appresi i modelli, è stato in grado di prevedere, con elevata precisione, le strutture di altre proteine non ancora caratterizzate.
Betül Kaçar dell’Università del Wisconsin-Madison e i suoi colleghi hanno fatto qualcosa di simile in uno studio pubblicato nel 2022. Stavano cercando di ricostruire la storia evolutiva delle proteine chiamate rodopsine, che i batteri utilizzano per assorbire l’energia della luce. In particolare, volevano sapere quali tipi di luce assorbissero le prime rodopsine, in quanto ciò avrebbe indicato il tipo di ambiente in cui si sono evolute.
Confrontando i geni che codificano per la rodopsina in microbi imparentati tra loro, sono stati in grado di stimare le sequenze dei più antichi geni della rodopsina, geni che non esistono più. Inoltre, hanno concluso che queste prime proteine di rodopsina erano sintonizzate su specifiche frequenze di luce. Ciò è stato determinato utilizzando una tecnica di apprendimento automatico sviluppata da un altro gruppo, in grado di prevedere la sensibilità alla luce delle rodopsine attuali. Il team di Kaçar ha utilizzato l’apprendimento automatico per dimostrare che le rodopsine primordiali erano più sensibili alla luce verde. Questo suggerisce che i microbi di cui facevano parte vivevano un po’ al di sotto della superficie di un corpo idrico, dove le altre frequenze di luce erano bloccate dall’acqua. Ciò si accorda con altre linee di evidenza circa l’origine della prima vita.
Esplorare il disordine
Che dire di queste complesse miscele di sostanze chimiche? Un approccio alla loro comprensione è stato sperimentato dal chimico sintetico Bartosz Grzybowski presso l’Institute for Basic Science di Ulsan, nella Repubblica di Corea, in uno studio pubblicato nel 2020.
Il team ha raccolto dati sulla chimica prebiotica da decine di articoli pubblicati a partire dall’esperimento di Miller del 1953, ognuno dei quali dimostrava un piccolo numero di reazioni. Li hanno combinati in un unico database, creando una rete di reazioni. Poi hanno scritto un programma informatico per prevedere nuove reazioni, basandosi su quali tipi di interazioni possono avvenire tra diversi tipi di sostanze chimiche.
Partendo da sei semplici materiali di partenza, tra cui acqua e ammoniaca, hanno dimostrato che era possibile creare decine di migliaia di sostanze chimiche in condizioni blande, tra cui molte di quelle presenti negli organismi vivi. Inoltre, il software ha previsto reazioni mai osservate, molte delle quali sono state eseguite dai ricercatori. In un colpo solo, hanno identificato una serie di nuove reazioni chimiche che potrebbero essere state importanti nella formazione della prima vita.
Lo studio sarebbe stato impossibile senza il software. “Un essere umano non è in grado di mappare una rete di decine, migliaia o milioni di connessioni”, afferma Grzybowski. Tuttavia, egli sottolinea che il software è stato codificato da chimici e obbedisce a regole esplicite. “Non definirei nemmeno la nostra ricerca IA”, dice, ma piuttosto “un sistema ibrido”.
Nonostante le previsioni corrette, la rete di reazioni di Grzybowski è ancora un po’ teorica. Dobbiamo anche sapere a che velocità avviene ciascuna reazione e se i sottoprodotti delle reazioni precedenti interferiscono con quelle successive. Huck, chimico dell’Università Radboud nei Paesi Bassi, e i suoi colleghi hanno iniziato ad affrontare questo problema con l’aiuto dell’apprendimento automatico.
In uno studio pubblicato nel 2022, il team di Huck ha eseguito la reazione di formosi, che crea zuccheri da semplici molecole a base di carbonio. Dato che uno zucchero chiamato desossiribosio è usato per creare il DNA, la creazione di zuccheri è una fase iniziale cruciale per le origini della vita. La reazione del formoso fa questo, ma c’è un problema. Tende a subire una “esplosione combinatoria”, dice Huck: genera decine o centinaia di prodotti, che variano enormemente a seconda delle condizioni esatte.
Il team di Huck ha condotto la reazione in piccole camere di flusso per tenerla sotto controllo. Hanno variato una serie di condizioni, tra cui la temperatura e la disponibilità di diverse sostanze chimiche; hanno interrotto la reazione una volta che aveva prodotto alcune decine di sostanze chimiche e hanno analizzato la miscela.
Le condizioni ambientali, come la temperatura, determinano i prodotti che si formano nella reazione, spiega Huck. Tuttavia, non è ovvio come e perché: piccoli cambiamenti nelle condizioni a volte hanno un effetto minimo, ma a volte portano a risultati drasticamente diversi. È qui che è intervenuto l’apprendimento automatico: dopo un po’ di addestramento, il software è stato in grado di prevedere cosa avrebbe prodotto la reazione. Questo ci porta a un passo dalla comprensione delle condizioni di produzione degli zuccheri sulla Terra primordiale.
Determinare le condizioni ambientali e gli altri parametri che prevalevano all’epoca è uno dei maggiori problemi per la ricerca sulle origini della vita, afferma Wentao Ma, modellatore informatico dell’Università di Wuhan in Cina. Tecniche come l’apprendimento automatico aiuteranno a restringere il campo. In uno studio del 2021, Ma e i suoi colleghi hanno simulato una miscela di acidi nucleici. Utilizzando l’apprendimento automatico, sono riusciti a trovare le condizioni ottimali per la creazione di acidi nucleici in grado di accelerare la formazione dei propri mattoni, il tipo di circolo virtuoso da cui dipende la vita.
Infine, l’apprendimento automatico può anche aiutare a creare simulazioni ad alta fedeltà dei meccanismi precisi con cui avvengono le reazioni chimiche, il che è fondamentale per prevedere quando funzionano o meno. Gli strumenti chiave sono i modelli informatici che simulano tutti gli atomi di una miscela mentre rimbalzano e interagiscono tra loro. “Quando eseguiamo la simulazione, possiamo avere accesso al comportamento microscopico del sistema”, spiega Timothée Devergne, modellista dell’Università Sorbona di Parigi.
Tuttavia, queste simulazioni “atomistiche” diventano rapidamente incredibilmente dispendiose in termini di tempo. Ogni singola interazione tra gli atomi richiede la risoluzione di equazioni complesse, quindi è stato molto difficile simulare le miscele complesse che esistevano sulla Terra primordiale. Di conseguenza, gli esperimenti di chimica prebiotica sono stati una sorta di scatola nera: possiamo vedere cosa viene sputato fuori, ma cosa sia successo esattamente è misterioso.
Devergne sta utilizzando l’apprendimento automatico per risolvere questo problema. Nel 2007, i ricercatori del Politecnico di Zurigo, in Svizzera, hanno sviluppato una rete neurale in grado di apprendere le soluzioni più probabili alle equazioni necessarie. Questo ha accelerato i calcoli di diversi ordini di grandezza. Devergne e i suoi colleghi stanno ora applicando questo metodo alla chimica prebiotica. Come prova di principio, in uno studio pubblicato nel 2022 hanno utilizzato l’apprendimento automatico per simulare le reazioni che hanno prodotto la glicina nell’esperimento di Miller, cosa che il supervisore di Devergne aveva precedentemente simulato senza l’apprendimento automatico. La rete neurale ha ridotto il tempo di calcolo di un fattore da 10 a 50. Risultati simili di un altro gruppo sono stati pubblicati come preprint nel 2022.
A cosa serve?
Tutti coloro che sono stati contattati per questo articolo concordano sul fatto che l’uso dell’apprendimento automatico e di altri strumenti di intelligenza artificiale nella ricerca sulle origini della vita è in una fase molto iniziale. Alcuni sono cauti nell’enfatizzare eccessivamente l’approccio.
“Non può dirci cose nuove, perché sa quello che sa”, afferma Valentina Erastova, scienziata computazionale dell’Università di Edimburgo. Gli strumenti di apprendimento automatico possono fare previsioni accurate solo dopo essere stati alimentati con enormi quantità di dati di alta qualità, afferma Erastova: “Può mostrare tendenze e collegamenti, ma i collegamenti che mostrerà sono completamente influenzati dal modo in cui lo si addestra”.
Ciò che è chiaro è che gli strumenti di tipo AI possono velocizzare ciò che altrimenti sarebbe un lavoro noioso. Ad esempio, nel 2018 il team di Cronin ha descritto un robot in grado di eseguire esperimenti e analisi chimiche più velocemente degli esseri umani. Ha utilizzato l’apprendimento automatico per valutare il progresso delle reazioni in tempo reale e per prevedere quali miscele reagiranno o meno. Cronin ha già trascorso anni a digitalizzare la chimica: intende utilizzare questi sistemi per condurre esperimenti di chimica prebiotica e scoprire i percorsi di formazione della vita. In analogia con AlphaFold, dice di voler creare “AlphaSoup”.
Il potere dell’apprendimento automatico consiste nella capacità di individuare schemi in enormi serie di dati quando l’uomo non può farlo. “Si possono individuare schemi in miscele complesse e individuare i processi in atto che non si possono individuare da soli”, dice Huck. “È uno spazio talmente alto e dimensionale che i modelli sfuggono”.
La speranza è che questi metodi permettano ai ricercatori di capire finalmente cosa succede in miscele complesse e interagenti come quelle trovate sulla Terra primordiale. “Questa tecnologia ci permette di studiare sistemi molto più grandi di prima”, afferma Devergne.
C’è un’ultima domanda. Supponiamo che uno degli esperimenti abbia successo e che un biochimico riesca a creare una semplice forma di vita in laboratorio o che il rover Perseverance su Marte scopra un microbo extraterrestre. Come faremo a sapere se ciò che stiamo osservando è veramente vivo?
“Si tratta di un vecchio problema di geochimica”, afferma Jim Cleaves, geochimico presso la Howard University di Washington. “Come si fa a dire che qualcosa è vivente o non vivente?”.
Per Cronin, la risposta è la “teoria dell’assemblaggio“. Lui e i suoi colleghi sostengono che la caratteristica distintiva della vita è la produzione di un gran numero di oggetti altamente complessi. Definiscono la complessità di un oggetto in base al numero di passaggi necessari per realizzarlo. In uno studio del 2021, hanno dimostrato di poter distinguere tra campioni prodotti dalla vita e campioni prodotti senza di essa, in base alla complessità misurata delle molecole. Per accelerare le analisi è stato utilizzato l’apprendimento automatico.
In uno studio pubblicato a settembre, Cleaves e i suoi colleghi hanno utilizzato l’apprendimento automatico in modo più diretto. Hanno addestrato una rete neurale su un’ampia gamma di sostanze, tra cui riso basmati, carbone e scisto. In seguito è stata in grado di identificare campioni biologici e non biologici con un’accuratezza del 90%. L’intelligenza artificiale ha utilizzato una metrica leggermente diversa da quella di Cronin: si concentra sul mix complessivo di componenti chimici all’interno di un campione, dice Cleaves, piuttosto che sulla complessità dei singoli componenti. “Si tratta di idee complementari”, spiega.
Secondo Cleaves, metodi come questi potrebbero essere applicati ai dati provenienti da sonde come i rover della NASA su Marte. Ad esempio, il rover Curiosity ha uno strumento chiamato Sample Analysis at Mars (SAM) che esegue analisi chimiche simili a quelle utilizzate dal suo team. Con modifiche relativamente piccole, dice, “si potrebbe fare anche adesso”.
Nel frattempo, ricercatori come Cronin e Huck stanno portando avanti i loro studi sulla biochimica primordiale. “Penso che saremo in grado di utilizzare tecniche di apprendimento automatico come AlphaFold, ma dovremo riqualificarle sulla zuppa chimica”, dice Cronin. “Dobbiamo creare AlphaSoup e saremo pronti”.
Michael Marshall è uno scrittore freelance che vive nel Regno Unito. Si occupa principalmente di scienze della vita, salute e ambiente. Il suo primo libro, The Genesis Quest, tratta delle origini della vita ed è in uscita.