L’AI potrebbe rendere l’assistenza sanitaria più equa

Un nuovo studio mostra come i modelli di apprendimento profondo per definire eventuali terapie mediche potrebbero aiutare a superare una serie di lacune nelle conoscenze mediche.

di Karen Hao

Negli ultimi anni, la ricerca ha dimostrato che l’apprendimento profondo può eguagliare prestazioni di alto livello in attività di imaging medico come la diagnosi precoce del cancro e la diagnosi delle malattie degli occhi. Ma rimane un motivo di cautela. Alcuni studi hanno dimostrato che l’apprendimento profondo ha la tendenza a perpetuare la discriminazione. Con un sistema sanitario già caratterizzato da disparità, le applicazioni approssimative di apprendimento profondo potrebbero peggiorare la situazione.

Ora un nuovo documento pubblicato su “Nature Medicine” propone un modo per sviluppare algoritmi medici che potrebbero aiutare a invertire, piuttosto che esacerbare, la disuguaglianza esistente. La chiave, afferma Ziad Obermeyer, professore associato dell’Università di Berkeley che ha supervisionato la ricerca, è interrompere l’addestramento degli algoritmi per coadiuvare le prestazioni degli esperti umani.

L’articolo esamina un esempio clinico specifico delle disparità esistenti nel trattamento dell’osteoartrosi del ginocchio, una malattia che causa dolore cronico. Valutare la gravità del dolore aiuta i medici a prescrivere il rimedio giusto, compresa la terapia fisica, i farmaci o la chirurgia. Questo viene tradizionalmente fatto da un radiologo che esamina una radiografia del ginocchio del paziente e segnala il dolore sul grado Kellgren–Lawrence (KLG), che calcola i livelli di dolore in base alla presenza di diverse caratteristiche radiografiche, come il grado di cartilagine mancante o danno strutturale.

Ma i dati raccolti dal National Institute of Health hanno scoperto che i medici che utilizzano questo metodo classificano sistematicamente la gravità del dolore dei pazienti neri molto al di sotto della sofferenza che queste persone dicono di provare. I pazienti segnalano autonomamente i loro livelli di dolore utilizzando un sondaggio che chiede informazioni sul dolore durante varie attività, come piegare e allungare la gamba. 

Ma questi livelli di dolore auto-riferiti vengono ignorati a preferenza del punteggio KLG del radiologo quando si prescrive la terapia. In altre parole, i pazienti neri che mostrano la stessa quantità di cartilagine mancante dei pazienti bianchi segnalano livelli più alti di dolore.

Questa situazione ha costantemente irritato gli esperti medici. Un’ipotesi è che i pazienti neri potrebbero riferire livelli di dolore più elevati per convincere chi li visita a prendere più sul serio il disturbo. Ma c’è una spiegazione alternativa. La stessa metodologia KLG potrebbe essere parziale. È stata sviluppata diversi decenni fa sulla base delle popolazioni britanniche bianche. 

Alcuni esperti medici sostengono che l’elenco dei marker radiografici che indica ai medici cosa cercare potrebbe non includere tutte le possibili fonti fisiche di dolore all’interno di una popolazione più diversificata. In altre parole, potrebbero esserci indicatori radiografici del dolore che appaiono più comunemente nelle persone di colore che semplicemente non fanno parte della rubrica KLG.

Per testare questa possibilità, i ricercatori hanno addestrato un modello di apprendimento profondo a prevedere il livello di dolore auto-riferito del paziente dalla radiografia del ginocchio. Se il modello fosse approssimativo, ciò suggerirebbe un valore piuttosto arbitrario del dolore riferito. Ma se il modello avesse una precisione davvero buona, ciò fornirebbe la prova che il dolore auto-riferito è in effetti correlato con i marker radiografici nella radiografia.

Dopo aver eseguito diversi esperimenti, i ricercatori hanno scoperto che il modello era molto più accurato di KLG nel prevedere i livelli di dolore auto-riportati sia per i pazienti bianchi che per quelli neri, ma soprattutto per i pazienti neri. Ha ridotto la disparità razziale di quasi la metà.

L’obiettivo non è necessariamente quello di iniziare a utilizzare questo algoritmo in un contesto clinico. Ma superando la metodologia KLG, ha rivelato che il modo standard di misurare il dolore è imperfetto e discriminatorio. Lo studio dovrebbe suggerire alla comunità medica di indagare su quali marcatori radiografici l’algoritmo dovrebbe considerare e aggiornare la loro metodologia di punteggio.

“Questi tipi di algoritmi devono essere utilizzati come strumenti nel processo di scoperta medica”, afferma Obermeyer. “per dirci se c’è qualcosa che vale la pena di guardare e che non capiamo”.”L’aspetto più interessante di questo documento è che guarda alle cose da una prospettiva completamente diversa”, afferma Irene Chen, ricercatrice del MIT che studia come ridurre le disuguaglianze sanitarie nell’apprendimento automatico. 

Invece di addestrare l’algoritmo sulla base di conoscenze specialistiche consolidate, continua Chen, i ricercatori hanno scelto di considerare l’autovalutazione del paziente come punto di partenza credibile. In questo modo si sono scoperte importanti lacune in quella che il campo medico di solito considera la misura del dolore più “oggettiva”. “Se gli algoritmi vengono addestrati solo per eguagliare le prestazioni degli esperti”, dice Obermever, “perpetueranno semplicemente le lacune e le disuguaglianze esistenti”.

Immagine di: Ms Tech

(rp)

Related Posts
Total
0
Share