Deepmind, società di Google, ha recentemente introdotto Med-PaLM M, la prima variante multimodale del suo Large Language Model, in grado di accedere, sfruttare e mettere in relazione miliardi di informazioni, come un medico umano. Ma i professionisti della salute in carne e ossa continuano a essere insostituibili.
Gli algoritmi di IA generativa, o GenAI, sono ormai parte integrante della nostra vita quotidiana. Hanno preso piede ad un ritmo senza precedenti, e stiamo ancora esplorando tutti i vari possibili utilizzi di questa nuova tecnologia. Nonostante ciò, i creatori di questi algoritmi, da OpenAI a Meta e Google, sono già all’opera sulla prossima evoluzione di questi modelli. OpenAI ha già registrato il marchio GPT-5, nonostante GPT-4 sia appena stato rilasciato al grande pubblico, e gli altri giganti del tech stanno anche loro facendo una “corsa alle armi”, investendo in aziende che gli possano dare un vantaggio competitivo (come è successo con Amazon e Anthropic). L’evoluzione di questi algoritmi, che finora erano limitati a un solo tipo di input (testo, audio, immagini, ecc.), sta nel concetto di multi-modalità, ovvero fornire vari tipi di input agli algoritmi, per fornirgli una visione d’insieme del compito. Un po’ come un essere umano si affida ai cinque sensi, allo stesso modo questi nuovi algoritmi di GenAI si stanno affidando a input testuale, immagini, audio, e molto altro ancora, allo stesso tempo. Questo passo in avanti sta fornendo agli algoritmi capacità che sono ormai quasi alla pari, se non addirittura a volte migliori, di quelle degli esseri umani e, talvolta, anche degli esperti, come per esempio i medici.
Con Med-PaLM M, Google Deepmind ha fatto proprio questo. L’azienda ha recentemente introdotto la prima variante multimodale del suo Large Language Model Med-PaLM. Nei mesi passati, infatti, Google ha lanciato la sua risposta a ChatGPT, un modello chiamato PaLM, formato da 540 miliardi di parametri, che, nonostante siano meno di GPT-4 (che ne possiede 1,76 trilioni), rivaleggia comunque con il prodotto di OpenAI in fatto di accuratezza. Successivamente, come sta accadendo in tutto il settore dell’IA, l’azienda ha deciso di addestrare il modello specificamente su dati relativi alla salute, creando Med-PaLM, una versione del modello di Google capace di analizzare dati sanitari con performance quasi alla pari di quella dei medici, fornendo diagnosi e quant’altro.
I medici, infatti, hanno un vantaggio chiaro rispetto ai modelli di IA proposti finora, come ChatGPT; oltre, ovviamente, alla loro capacità di empatizzare con i pazienti e di avere una relazione umana con essi. I medici, infatti, hanno la capacità di analizzare vari tipi di dati, dalle immagini radiografiche, alle informazioni testuali generati in altre visite, e anche la capacità di ascoltare il paziente e il suo stato d’animo. Per cercare di avvicinarsi a queste skills, e riuscire a creare un modello che riesce a fornire una visione d’insieme della situazione, Deepmind, il dipartimento di Google più orientato alla ricerca, ha fornito questo ulteriore aggiornamento a PaLM, introducendo Med-PaLM M, proprio per cercare di emulare, ancora di più, i medici. Questo algoritmo, capace di processare testo, immagini mediche e addirittura il genoma di una persona, può fornire diagnosi e analisi sulla salute analizzando tutte le informazioni a sua disposizione, in modo simile a un esperto. Med-PaLM M, o MPM, è un grande passo in avanti verso un dottore AI “all-purpose”, capace di emulare le capacità di un medico in tutto e per tutto, fornendo diagnosi o semplicemente rispondendo a domande generiche da parte dei pazienti. Gran parte della promessa di MPM risiede nella sua abilità di aver accesso a milioni di esempi, casi clinici e anni di lavoro, fornendo al modello una quantità di pazienti mai vista prima. Un dottore, infatti, dovrebbe lavorare per anni e anni, studiare migliaia o milioni di casi, un compito quasi impossibile, per poter acquisire l’esperienza che MPM riesce ad ottenere con il training.
Ciò non vuol dire che il modello sia, di per sé, “migliore” del medico. Anzi, i medici sono insostituibili, soprattutto non verranno sostituiti da una macchina incapace di relazionarsi a livello umano con il paziente. Tuttavia, è innegabile come questi algoritmi di IA abbiano capacità sovrumane, che vanno oltre quelle a cui noi possiamo pensare di aspirare in alcuni campi specifici. MPM, e molti altri modelli, infatti, hanno anche accesso a casi provenienti da vari paesi e zone remote del mondo, in altre lingue, inclusi casi rari, quasi mai visti. Questo permette al modello di poter diagnosticare con sicurezza anche i casi meno frequenti, avendo accesso a un database che è impensabile per l’iniziativa di una persona o di un gruppo. Possiamo infatti immaginarci un futuro in cui il modello non andrà a sostituire il medico, o l’infermiere, ma gli fornirà dei “superpoteri”. Questi algoritmi forniranno uno strumento ulteriore ai medici, che saranno capaci ora non solo di affidarsi alla propria esperienza, intuizione e capacità più umane, ma potranno anche porre quesiti a MPM, vedendo cosa il modello risponderebbe in un caso specifico e, soprattutto, utilizzarlo nei casi più rari e complessi, cercando di vedere se nel database di MPM ci sia un caso simile, che magari si è verificato in una zona diversa del globo. L’utilizzo di MPM o di altri algoritmi non sarà dissimile all’utilizzo di uno stetoscopio, in cui la decisione finale è sempre al dottore, e sarà semplicemente un’ulteriore fonte di informazione per il professionista della salute.
MPM, tuttavia, non è l’unico modello che sta mostrando capacità sovrumane in ambito medico. Hippocratic AI, un’azienda il cui nome richiama il giuramento di Ippocrate, un giuramento etico che tutti i medici fanno, sta infatti focalizzandosi specificamente nell’ambito della salute, un mercato che sta crescendo a una velocità senza precedenti, con proiezioni che stimano il mercato dell’AI for Health a circa 200 miliardi di dollari entro il 2030. Hippocratic AI sta cercando di creare Large Language Models (LLMs) che possano, in un futuro molto vicino, diventare il cervello di ChatBot che agiscano da nutrizionista, esperti di genetica ecc., fornendo ai pazienti ogni servizio relativo alla loro salute con un solo click. Il team sta cercando di risolvere uno dei problemi principali nel settore sanitario: la carenza di personale specializzato (medici, infermieri…), che a sua volta sta creando delle dinamiche problematiche nel settore salute. Nei prossimi anni, negli USA, si prevede che ci saranno 3 milioni di lavoratori specializzati in meno di quanti siano necessari, secondo Munjal Shah, il CEO dell’azienda.
Questo sta portando il settore sanitario a una crisi per cui già ora possiamo vedere come le tempistiche per ottenere una visita o per portare avanti una pratica stiano diventando bibliche, e come per ottenere cure di qualità e/o velocemente sia necessario pagare cifre molto alte. Questo non è solamente drammatico dal punto di vista finanziario ma anche da quello etico e morale. In questo modo, le persone meno abbienti avranno sempre meno possibilità di ottenere cure di qualità, o addirittura di potersi permettere le cure, peggiorando un divario che già ora si sta facendo sentire. Per colmare questo divario, secondo Shah, è impossibile affidarsi a nuovi specialisti del settore sanitario perché il problema è ormai troppo elevato ed è impensabile poter formare così tanti specialisti in poco tempo. La tecnologia, invece, è il catalizzatore che fornirà, e sta fornendo, soluzioni per colmare questo divario, offrendo una soluzione pragmatica a un problema che rischia di mettere in ginocchio le nazioni. Questi modelli, sviluppati da Hippocratic AI stanno già mostrando le loro potenzialità, passando i test per l’abilitazione medica con risultati leggermente migliori dei medici, da quanto riporta l’azienda. Lo stesso vale per i test per diventare infermieri, nutrizionisti e farmacisti, che mostrano le potenzialità dei loro LLMs di generalizzare.
Un’altra azienda che ha capito l’enorme potenzialità del settore sanitario e sta cercando di rivoluzionarlo con LLMs è Microsoft. Recentemente, infatti, Microsoft ha acquisito Nuance, un’azienda che si occupa di trascrizione di conversazioni in testo. Per quale motivo Microsoft dovrebbe mai interessarsi di un aspetto così specifico? Tutto sta, di nuovo, nelle sfide che i professionisti nel settore sanitario stanno affrontando. Negli Stati Uniti, per esempio, i medici spendono circa 15.5 ore a settimana in burocrazia e compiti amministrativi. Ciò vuol dire che circa due giornate lavorative standard da 8 ore sono trascorse dai dottori a inserire informazioni nei computer, selezionare i codici diagnostici e procedurali che sono relativi a uno specifico paziente, e altro. Ciò vuol dire che tutto questo tempo è tolto ai pazienti, accorciando il tempo che i medici possono spendere nel compito che li appassiona di più e che è più richiesto dai pazienti: il tempo impiegato nel dialogo tra paziente e dottore. Non c’è da sorprendersi se questo enorme onere amministrativo stia anche portando a un tasso senza precedenti di medici che sono in burnout, affaticati dal dover inserire così tante informazioni in sistemi medici antiquati. Nuance sta cercando di risolvere proprio questo problema. I team di Nuance e Microsoft stanno, infatti, cercando di creare una realtà in cui una volta che il paziente entra nello studio del dottore, il professionista può semplicemente fare domande al paziente e conversarci liberamente, lasciando alla tecnologia di Nuance il compito di trascrivere l’audio in testo, e utilizzando poi LLMs che uniscono testo e audio per creare un riepilogo della visita e assegnare automaticamente i codici diagnostici e procedurali necessari, immetterli nel database e permettere al medico di fare il proprio lavoro. Questa tecnologia, che è in fase di test, mostra un’ulteriore capacità dei modelli di Intelligenza Artificiale, che va oltre le capacità diagnostiche.
Tutte queste applicazioni stanno mostrando non solamente la promessa che risiede nella tecnologia che è l’IA Generativa, ma anche l’enorme potenzialità per tradurre la teoria in risultati pragmatici che portano a miglioramenti nella condizione di vita dei pazienti e dei medici. Quello che è certo è che la direzione che i modelli di IA stanno prendendo è quella della multimodalità, che aggrega informazioni provenienti da diversi formati, in un modo non dissimile da come un essere umano processa l’informazione, creando algoritmi che richiamano sempre di più l’intelligenza vera e propria, quella umana. A volte in modi che ci fanno dimenticare che stiamo interagendo con una macchina.
Eugenio Zuccarelli è un AI Leader che lavora a New York presso CVS Health, l’azienda sanitaria numero uno al mondo. Ha studiato al MIT, a Harvard e all’Imperial College.