Skip to main content

Un nuovo studio mostra che l’intelligenza artificiale può gestire in autonomia anche le mammografie al seno, affiancando il lavoro dei radiologi e aumentando il numero di screening

Hana Kiros

Secondo una nuova ricerca, i radiologi assistiti da uno screening AI per il cancro al seno ottengono  risultati migliori rispetto a quando lavorano da soli. Inoltre, l’intelligenza artificiale ha prestazioni di più alto livello nelle mani di un radiologo rispetto a quando opera da solo. Lo studio su larga scala, pubblicato questo mese su “The Lancet Digital Health”, è il primo a confrontare direttamente il funzionamento dell’AI nello screening del cancro al seno in autonomia o assistita da un esperto umano. La speranza è che tali sistemi di intelligenza artificiale possano salvare vite, rilevando i tumori sconosciuti ai medici e alleviando allo stesso tempo il carico di lavoro degli specialisti.

Il software dello studio  è fornito da Vara, una startup tedesca. L’AI dell’azienda è già utilizzata in oltre un quarto dei centri di screening del cancro al seno della Germania ed è stata introdotta all’inizio di quest’anno in un ospedale in Messico e in un altro in Grecia. Il team di Vara, con l’aiuto dei radiologi dell’Essen University Hospital in Germania e del Memorial Sloan Kettering Cancer Center di New York, ha testato due approcci. 

Nel primo, l’AI lavora da sola per analizzare le mammografie. Nell’altro, l’AI distingue automaticamente tra le scansioni che ritiene normali e quelle che destano preoccupazione. Segnala queste ultime a un radiologo, che le esamina prima di vedere i risultati a cui è giunta l’AI. 

Per addestrare la rete neurale, Vara ha fornito i dati AI di oltre 367.000 mammografie, inclusi gli appunti dei radiologi, le valutazioni originali e le informazioni sul fatto che il paziente alla fine avesse il cancro, per imparare come inserire queste scansioni in una delle tre categorie: “normale”, “neutra” (in cui non viene fornita alcuna previsione) e “probabile cancro”. Le conclusioni di entrambi gli approcci sono state quindi confrontate con le decisioni originariamente prese dai radiologi reali su 82.851 mammografie provenienti da centri di screening che non facevano parte delle scansioni utilizzate per addestrare l’AI.

Il secondo approccio, che vede medico e intelligenza artificiale lavorare insieme, è stato del 3,6% migliore nel rilevare il cancro al seno rispetto a un medico che lavorava in autonomia e ha sollevato meno falsi allarmi. Ci è riuscito mettendo da parte automaticamente le scansioni classificate come normali, che ammontavano al 63% di tutte le mammografie. Questa semplificazione potrebbe ridurre i carichi di lavoro dei radiologi.

Dopo lo screening del cancro al seno, vengono avviati test di follow-up per le pazienti con una scansione dubbia. Ma ai radiologi che esaminano le mammografie sfugge un caso di cancro su 8Stanchezza, superlavoro e persino l’ora del giorno influiscono sulla capacità dei radiologi di identificare i tumori mentre visualizzano migliaia di scansioni. I segni visivamente sottili hanno anche generalmente meno probabilità di innescare allarmi e il tessuto mammario denso, che si trova principalmente nelle pazienti più giovani, rende più difficili vedere tracce del cancro.

I radiologi che utilizzano l’AI nel mondo reale sono tenuti dalla legge tedesca a guardare ogni mammografia, dando almeno un’occhiata a quelle che l’AI giudica normali. Thilo Töllner, un radiologo che dirige un centro tedesco di screening del cancro al seno, ha utilizzato il programma per due anni. A volte non è d’accordo quando l’AI classifica le scansioni come normali e compila manualmente i rapporti per indicare una conclusione diversa, ma la maggior parte delle volte concorda con l’AI.

Le mammografie che l’intelligenza artificiale ha etichettato come ambigue o “probabile cancro” vengono indirizzate a un radiologo, ma solo dopo che il medico ha offerto una valutazione iniziale e indipendente. I radiologi classificano le mammografie su una scala da 0 a 6 nota come BI-RADS, dove la valutazione più bassa è quella migliore. Un punteggio di 3 indica che si tratta di qualcosa probabilmente benigno, ma vale la pena controllare. Se Vara ha assegnato un punteggio BI-RADS di 3 o superiore a una mammografia che il radiologo etichetta come normale, viene visualizzato un avviso.

L’AI generalmente eccelle nella classificazione delle immagini. Allora perché l’AI di Vara da sola ha sottoperformato le prestazioni del singolo medico? Parte del problema è che una mammografia da sola non può determinare se qualcuno ha il cancro, in quanto serve l’analisi del tessuto dall’aspetto anormale.

Christian Leibig, autore principale dello studio e direttore dell’apprendimento automatico presso Vara, afferma che le mammografie di mammelle sane e cancerose possono sembrare molto simili ed entrambi i tipi di scansioni possono presentarsi in più forme. Questo complica l’allenamento delle AI che sono addestrate su scansioni mammarie sane e sono soggette ad accettare falsi positivi. Così si spiega la bassa incidenza di casi di cancro negli screening mammari (secondo Leibig, “in Germania, sono circa sei su 1.000”). 

Lo studio ha testato l’AI solo su decisioni mammografiche passate e ha dato per scontato che i radiologi sarebbero stati d’accordo con l’AI ogni volta che avesse emesso una decisione di “normale” o “probabile cancro”. Quando l’AI si manteneva neutra, lo studio ha fatto riferimento alla lettura del radiologo originale. Ciò significa che non è stato possibile verificare in che modo l’utilizzo dell’AI influenzi le decisioni dei radiologi e se tali modifiche possano creare nuovi rischi. Töllner ammette di dedicare meno tempo a esaminare le scansioni che Vara etichetta come normali di quelle che ritiene sospette. “Si va più veloci perché ci si fida del sistema”, spiega.

Curtis Langlotz, direttore del Center for Artificial Intelligence in Medicine and Imaging di Stanford, sostiene che il passo successivo sarà confermare le prestazioni dell’AI per un lungo periodo di tempo in cliniche con pazienti reali. Finora, i tentativi di sostituire completamente i radiologi con l’AI sono falliti. Una ricerca del 2021 ha rilevato che in 34 su 36 studi, l’AI ha ottenuto risultati peggiori di un singolo radiologo nello screening per il cancro al seno dalle mammografie. Tutti e 36 erano meno accurati del consenso di due radiologi, come richiesto da alcuni paesi.

“Si dice spesso che l’AI non sostituirà i radiologi”, afferma Langlotz. “Questo studio non cambia le cose, ma nel processo proposto basato sull’intelligenza artificiale quasi tre quarti degli studi di screening non hanno avuto bisogno di essere rivisti da un radiologo, migliorando nel complesso l’accuratezza. Il risultato è innovativo”, conclude.

A suo parere, in questo modo si potrebbe alleviare la carenza di radiologi, soprattutto in paesi come il Malawi (uno ogni 8,8 milioni di persone) o l’India (uno ogni 100.000 persone). Anche gli Stati Uniti, che in proporzione hanno 10 volte più radiologi dell’India, si prevede che entro il 2033 saranno a corto di 17.0000 radiologi.

Image by Alexandr Ivanov from Pixabay

(rp)