Skip to main content
BELL HUTLEY

Dopo decenni di frustrazione, gli strumenti di apprendimento automatico stanno sbloccando un tesoro di dati acustici per gli ecologi.

Un piccolo uccello canoro si libra sopra Ithaca, New York, in una notte di settembre. È uno dei 4 miliardi di uccelli, un grande fiume annuale di migrazione di piume attraverso il Nord America. A mezz’aria, emette quello che gli ornitologi chiamano “richiamo di volo notturno” per comunicare con il suo stormo. È il più breve dei segnali, lungo appena 50 millisecondi, emesso nei boschi nel cuore della notte. Ma gli esseri umani lo hanno comunque catturato, con un microfono sormontato da un imbuto di focalizzazione. Pochi istanti dopo, un software chiamato BirdVoxDetect, frutto di una collaborazione tra la New York University, il Cornell Lab of Ornithology e l’École Centrale de Nantes, identifica l’uccello e lo classifica a livello di specie.

Biologi come Andrew Farnsworth della Cornell sognavano da tempo di poter osservare gli uccelli in questo modo. In un mondo sempre più caldo e pieno di infrastrutture umane che possono essere letali per loro, come grattacieli di vetro e linee elettriche, gli uccelli migratori si trovano ad affrontare molte minacce esistenziali. Gli scienziati si affidano a una combinazione di metodi per tracciare i tempi e la posizione delle loro migrazioni, ma ognuno di essi presenta delle lacune. Il radar Doppler, con l’esclusione delle condizioni atmosferiche, è in grado di rilevare la biomassa totale di uccelli in volo, ma non può suddividerla per specie. Le etichette GPS sui singoli uccelli e le attente osservazioni dei cittadini-scienziati contribuiscono a colmare questa lacuna, ma la marcatura degli uccelli su scala è una proposta costosa e invasiva. E c’è un altro problema fondamentale: la maggior parte degli uccelli migra di notte, quando è più difficile identificarli visivamente e mentre la maggior parte degli ornitologi è a letto. Per oltre un secolo, il monitoraggio acustico è rimasto fuori dalla portata di un metodo che avrebbe risolto i problemi degli ornitologi.

Alla fine del 1800, gli scienziati si resero conto che gli uccelli migratori emettevano richiami notturni specifici per ogni specie, le cosiddette “impronte digitali acustiche”. Quando negli anni Cinquanta i microfoni sono diventati disponibili in commercio, gli scienziati hanno iniziato a registrare gli uccelli di notte. Farnsworth ha guidato alcune di queste ricerche di ecologia acustica negli anni ’90. Ma già allora era difficile individuare i brevi richiami, alcuni dei quali si trovano al limite della gamma di frequenze udibili dall’uomo. Gli scienziati si ritrovavano con migliaia di nastri che dovevano esaminare in tempo reale guardando gli spettrogrammi che visualizzano l’audio. Anche se la tecnologia digitale ha reso più facile la registrazione, il “problema perenne”, dice Farnsworth, “era che diventava sempre più facile raccogliere un’enorme quantità di dati audio, ma sempre più difficile analizzarne anche solo una parte”.

Poi Farnsworth ha incontrato Juan Pablo Bello, direttore del Music and Audio Research Lab della NYU. Fresco di un progetto che utilizzava l’apprendimento automatico per identificare le fonti di inquinamento acustico urbano a New York, Bello ha accettato di occuparsi del problema dei richiami notturni. Ha messo insieme un team che comprendeva l’esperto francese di ascolto automatico Vincent Lostanlen e nel 2015 è nato il progetto BirdVox per automatizzare il processo. “Tutti pensavano: “Alla fine, quando questa problema sarà stato decifrato, sarà una fonte di informazioni super-ricca””, racconta Farnsworth. Ma all’inizio, ricorda Lostanlen, “non c’era nemmeno un accenno alla possibilità di farlo”. Sembrava inimmaginabile che l’apprendimento automatico potesse avvicinarsi alle capacità di ascolto di esperti come Farnsworth.

“Andrew è il nostro eroe”, dice Bello. “L’intera cosa che vogliamo imitare con i computer è Andrew”.

Hanno iniziato addestrando BirdVoxDetect, una rete neurale, a ignorare i difetti come i bassi ronzii causati dai danni dell’acqua piovana ai microfoni. Poi hanno addestrato il sistema a rilevare i richiami di volo, che differiscono tra le specie (e anche all’interno di esse) e possono essere facilmente confusi con il cinguettio dell’allarme di un’auto o di un cercatore di primavera. La sfida, spiega Lostanlen, era simile a quella che deve affrontare un altoparlante intelligente quando ascolta la sua unica “parola d’ordine”, solo che in questo caso la distanza tra il rumore bersaglio e il microfono è molto maggiore (il che significa molto più rumore di fondo da compensare). E, naturalmente, gli scienziati non hanno potuto scegliere un suono unico come “Alexa” o “Hey Google” per la loro attivazione. “Per gli uccelli, non è una scelta che facciamo noi. Charles Darwin ha fatto questa scelta per noi”, scherza. Per fortuna, avevano molti dati di addestramento con cui lavorare: il team diarnsworth aveva annotato a mano migliaia di ore di registrazioni raccolte dai microfoni di Ithaca.

Con BirdVoxDetect addestrato a rilevare i richiami di volo, si prospettava un altro compito difficile: insegnargli a classificare i richiami rilevati in base alle specie, cosa che pochi esperti di uccelli sanno fare a orecchio. Per far fronte all’incertezza e poiché non esistono dati di addestramento per ogni specie, si è optato per un sistema gerarchico. Ad esempio, per un dato richiamo, BirdVoxDetect potrebbe essere in grado di identificare l’ordine e la famiglia dell’uccello, anche se non è sicuro della specie, così come un esperto di uccelli potrebbe almeno identificare un richiamo come quello di un usignolo, sia esso dal ciuffo giallo o dal collare. Durante l’addestramento, la rete neurale è stata meno penalizzata quando ha confuso uccelli che erano più vicini nell’albero tassonomico.

Lo scorso agosto, a coronamento di otto anni di ricerca, il team ha pubblicato un documento che illustra in dettaglio gli algoritmi di apprendimento automatico di BirdVoxDetect. Inoltre, ha rilasciato il software come prodotto gratuito e open-source che gli ornitologi possono utilizzare e adattare. In un test su un’intera stagione di registrazioni di migrazione per un totale di 6.671 ore, la rete neurale ha individuato 233.124 chiamate di volo. In uno studio del 2022 pubblicato sul Journal of Applied Ecology, il team che ha testato BirdVoxDetect ha riscontrato che i dati acustici sono efficaci quanto il radar per la stima della biomassa totale.

BirdVoxDetect funziona su un sottoinsieme di uccelli canori migratori del Nord America. Ma grazie all’apprendimento “a pochi colpi”, può essere addestrato a rilevare altri uccelli simili con pochi esempi di addestramento. È come imparare una lingua simile a quella che già si parla, dice Bello. Con microfoni a basso costo, il sistema potrebbe essere esteso a luoghi del mondo privi di ornitologi o radar Doppler, anche in condizioni di registrazione molto diverse. “Se si va a una conferenza di bioacustica e si parla con diverse persone, tutte hanno casi d’uso diversi”, dice Lostanlen. Il prossimo passo per la bioacustica è creare un modello di base, come quelli a cui gli scienziati stanno lavorando per l’elaborazione del linguaggio naturale e l’analisi di immagini e video, che sia riconfigurabile per qualsiasi specie, anche al di fuori degli uccelli. In questo modo, gli scienziati non dovranno costruire un nuovo BirdVoxDetect per ogni animale che vogliono studiare.

Il progetto BirdVox è stato completato, ma gli scienziati stanno già sviluppando i suoi algoritmi e il suo approccio. Benjamin Van Doren, biologo migratore dell’Università dell’Illinois Urbana-Champaign che ha lavorato a BirdVox, sta utilizzando Nighthawk, una nuova rete neurale di facile utilizzo basata su BirdVoxDetect e sulla popolare applicazione Merlin per l’identificazione del canto degli uccelli, per studiare gli uccelli che migrano su Chicago e altrove in Nord e Sud America. Dan Mennill, che dirige un laboratorio di bioacustica all’Università di Windsor, dice di essere entusiasta di provare Nighthawk sui richiami di volo che il suo team attualmente annota a mano dopo averli registrati dai microfoni sulla sponda canadese dei Grandi Laghi. Un punto debole del monitoraggio acustico è che, a differenza del radar, un singolo microfono non è in grado di rilevare l’altitudine di un uccello in volo o la direzione in cui si muove. Il laboratorio di Mennill sta sperimentando un array di otto microfoni in grado di triangolare per risolvere questo problema. Il vaglio delle registrazioni è stato lento. Ma con Nighthawk l’analisi si velocizzerà notevolmente.

Con gli uccelli e gli altri animali migratori in pericolo, dice Mennill, BirdVoxDetect è arrivato al momento giusto. Sapere esattamente quali uccelli stanno sorvolando in tempo reale può aiutare gli scienziati a tenere sotto controllo la situazione delle specie e la loro destinazione. In questo modo, si possono realizzare iniziative pratiche di conservazione, come le iniziative “Lights Out”, che incoraggiano i grattacieli a oscurarsi di notte per evitare collisioni con gli uccelli. “La bioacustica è il futuro della ricerca sulla migrazione, e siamo appena arrivati alla fase in cui disponiamo degli strumenti giusti”, ha dichiarato. “Questo ci introduce in una nuova era”.

Christian Elliott è un giornalista scientifico e ambientale con sede in Illinois.