Skip to main content

Il creatore del famoso assistente vocale sogna un mondo in cui Alexa è ovunque, anticipando ogni esigenza dell’utente.

di Karen Hao

Ho iniziato a usare Alexa prima che diventasse una moda. Ho comprato un Echo di prima generazione pochi mesi dopo il suo lancio perché Amazon.com mi ha mostrato un banner pubblicitario mentre stavo acquistando nuovi altoparlanti. Al suo arrivo, la mia allora compagna di stanza, un ingegnere del software di Google, ha messo a confronto le capacità di Alexa con quelle del suo Assistente Google. Alexa ha perso la partita, ma per quanto mi riguardava, faceva tutto ciò che desideravo: suonava le mie canzoni preferite, mi svegliava la mattina e talvolta mi informava su quanto accadeva nel mondo e sul meteo.

A distanza di cinque anni, Alexa è dovunque ed è in grado di controllare oltre 85.000 prodotti per la casa intelligente, dalla TV ai campanelli agli auricolari. Può eseguire oltre 100.000 “compiti” e conteggi. Elabora miliardi di interazioni a settimana, generando enormi quantità di dati su programmi, preferenze e posizioni dell’utente. Alexa si è trasformato in un impero e Amazon sta facendo solo i primi passi.

Parlando con “MIT Technology Review” americana, Rohit Prasad, responsabile scientifico di Alexa, ha ora rivelato ulteriori dettagli sulla direzione di sviluppo di Alexa. Il punto cruciale del piano è che l’assistente vocale passi dalle interazioni passive a quelle proattive. Anziché attendere e rispondere alle richieste, Alexa anticiperà ciò che l’utente potrebbe desiderare. L’idea è quella di trasformare Alexa in un compagno onnipresente che modella e orchestra attivamente la vita dell’utente.

Prasad, che in giornata illustrerà il futuro di Alexa al WebSummit di Lisbona, in Portogallo, ha già fornito un’anteprima di come sarà questo cambiamento. A giugno alla conferenza re: Mars ha presentato Alexa Conversations, una demo che mostra come potrebbe essere usato l’assistente per pianificare una serata fuori casa.

Invece di avviare manualmente una nuova richiesta per le diverse fasi della serata, l’utente dovrà solo iniziare la conversazione, per esempio chiedendo di prenotare i biglietti per il cinema. Alexa domanderà se è necessario anche prenotare un ristorante o chiamare Uber.

Per sostenere questa conversazione, Amazon ha bisogno di hardware e software. A settembre, il colosso della tecnologia ha lanciato una suite di prodotti Alexa “on the go“, inclusi Echo Buds (auricolari wireless) ed Echo Loop (un anello intelligente). Tutti questi nuovi prodotti consentono ad Alexa di ascoltare e registrare i dati relativi a una parte della vita dell’utente notevolmente più ampia, per offrire forme di assistenza più informate sulla sua posizione, le sue azioni e le sue preferenze.

Dal punto di vista del software, queste abilità richiedono ad Alexa di utilizzare nuovi metodi per elaborare e comprendere tutte le diverse fonti di informazioni. Negli ultimi cinque anni, il team di Prasad si è concentrato sulla padronanza dell’assistente dei fondamenti dell’IA, come il riconoscimento vocale, i video di base e una migliore comprensione del linguaggio naturale.

Oltre a queste abilità di base, ora lavorano sulle capacità di previsione e sulle decisione intelligenti di Alexa e, soprattutto, sulla sua capacità di ragionamento di livello superiore. L’obiettivo, in altre parole, è che l’intelligenza artificiale di Alexa diventi molto più sofisticata in pochi anni.

Un Alexa più intelligente

Ecco come gli aggiornamenti del software di Alexa organizzano l’uscita serale. Per suggerire una cena e un taxi, una rete neurale impara, attraverso miliardi di interazioni di utenti a settimana, a riconoscere che tipo di comportamenti ricorrono. La previsione intelligente entra in gioco a questo punto. Se un numero sufficiente di utenti prenota una cena dopo un film, Alexa offrirà un pacchetto che contiene entrambe.

Ma è necessario il “ragionamento” per sapere a che ora prenotare il taxi. Tenendo conto della posizione dell’utente e del teatro, dell’ora di inizio del film e del traffico previsto, Alexa capisce quando l’auto dovrebbe trovarsi in quel determinato posto.

In un altro scenario, l’utente potrebbe chiedere ad Alexa attraverso l’echo di casa di inviare una notifica se il volo è in ritardo. Quando si avanza la richiesta, probabilmente si è già in auto. Alexa deve rendersi conto (identificando la voce nella richiesta iniziale) che l’utente, non un compagno di stanza o un membro della famiglia, ha bisogno della notifica e, in base all’ultimo dispositivo abilitato per Echo con cui è avvenuta l’interazione, deve mandarla direttamente all’utente in auto e non a casa.

Questo livello di predizione e ragionamento dovrà anche tenere conto dei dati video poiché sempre più prodotti sono compatibili con le fotocamere di Alexa. Immaginiamo che l’utente non sia in casa, dice Prasad, e una giovane scout bussa alla porta per vendere biscotti. L’Alexa sull’Amazon Ring, un campanello dotato di fotocamera, dovrebbe registrare (tramite ingresso audio e video) chi è alla porta, capire perché, sapere che non si è a casa e mandare una nota su un dispositivo Alexa vicino chiedendo quanti biscotti vuole l’utente, ordinandoli per suo conto.

Per renderlo possibile, il team di Prasad sta ora testando una nuova architettura software per l’elaborazione dei comandi dell’utente, che prevede il filtraggio di informazioni audio e visive attraverso più livelli. Innanzitutto Alexa deve registrare a quale servizio l’utente sta tentando di accedere tra i circa 100.000 disponibili. Successivamente dovrà comprendere il comando nel contesto dell’utente, quale dispositivo sta utilizzando quella persona e in che luogo. Infine, dovrà affinare la risposta sulla base delle preferenze precedentemente espresse dall’utente.

“Questo è il panorama futuro: mettere insieme ragionamento, personalizzazione e comprensione del contesto”, spiega Prasad.

Una verità ovvia

Dal punto di vista tecnico, sarebbe un risultato incredibile. Ciò di cui Prasad sta parlando – combinando varie fonti di dati e metodi di apprendimento automatico per condurre ragionamenti di alto livello – è stato per decenni un obiettivo dei ricercatori di intelligenza artificiale.

Dal punto di vista del consumatore, tuttavia, questi cambiamenti hanno anche importanti implicazioni sulla privacy. La visione di Prasad presume che Alexa segua l’utente ovunque, sappia ciò che sta facendo in un dato momento e sia l’interfaccia principale nell’organizzazione della sua vita. Questo processo richiede la conoscenza di enormi quantità di dettagli intimi sulla vita dell’utente.

Alcuni temono che Amazon finirà per non limitarsi, utilizzando i dati per fare pubblicità e proporre prodotti commerciali. “In definitiva si tratta di monetizzare la vita quotidiana di individui e gruppi di persone”, afferma Jeffrey Chester, direttore esecutivo del Center for Digital Democracy, un’organizzazione di tutela della privacy dei consumatori con sede a Washington.

Pressato su questo punto, Prasad ha sottolineato che il suo team ha reso più semplice per gli utenti la periodica cancellazione automatica dei propri dati e la possibilità del controllo dei dati da parte di operatori umani. Nessuna delle due opzioni impedisce tuttavia ai dati di essere utilizzati per addestrare la miriade di modelli di apprendimento automatico di Alexa.

In realtà, Prasad ha parlato di una ricerca in corso che cambierebbe il sistema di formazione di Alexa, aggiornando i modelli ogni volta che ci sono nuovi dati dell’utente e acquisendoli prima che vengano eliminati. In altre parole, la cancellazione automatica dei dati significherà solo che non saranno disponibili per addestrare i modelli futuri una volta che gli algoritmi di addestramento sono stati aggiornati; per i modelli attuali, questi dati verrebbero utilizzati (Nelle richieste di follow-up, un portavoce di Amazon ha dichiarato che l’azienda non ha venduto i dati raccolti da Alexa a inserzionisti di terze parti né a target pubblicitari, a meno che l’utente non accedesse a un servizio tramite Alexa, come Amazon.com.).

Jen King, direttore della privacy presso il Center for Internet and Society della Stanford Law School, afferma che questi tipi di controllo dei dati sono troppo superficiali. “Se vuoi offrire alle persone un potere di controllo significativo, allora devi essere in grado di rispettare la loro decisione di rinunciare completamente a cedere i loro dati o concedere loro delle alternative”, egli sostiene. “Dare a qualcuno un aiuto nel luogo in cui si trova potrebbe essere fatto in modo estremamente rispettoso della privacy. Non credo che il problema sia insormontabile”.

In primo luogo, immagina King, Amazon dovrebbe consentire agli utenti di optare per qualcosa, invece di limitarsi a negare l’utilizzo dei propri dati. In secondo luogo, Amazon dovrebbe essere più trasparente sulle finalità d’utilizzo. Al momento, quando vengono eliminati i dati dell’utente, non è chiaro cosa l’azienda potrebbe averci già fatto.

“Supponiamo di avere una telecamera di sorveglianza dell’IA in casa, di aver dimenticato che era accesa e di camminare nudi per la casa”, continua King . “Come consumatore sarebbe utile sapere, quando elimini quei file, se il sistema li ha già utilizzati per addestrare un qualsiasi algoritmo”.

Infine, Amazon dovrebbe offrire agli utenti una maggiore flessibilità su quando e dove possono essere utilizzati i suoi dati. “Le aziende tecnologiche tendono a progettare questi prodotti con l’idea del tutto o niente”, egli spiega. “Penso che sia un modo davvero fuorviante di affrontare questo problema. Le persone potrebbero desiderare alcune delle comodità che offrono le tecnologie, ma ciò non significa che le vogliano presenti in ogni aspetto della loro vita”.

La visione finale di Prasad è rendere Alexa disponibile e utile per tutti. Per i paesi in via di sviluppo, immagina versioni più economiche a cui le persone possono accedere sul proprio smartphone. “Il nostro obiettivo è spostare il carico cognitivo su compiti di routine”, conclude Prasad. “Voglio che Alexa sia davvero onnipresente per aiutare chiunque lo voglia”.

Immagine: Suite di prodotti Amazon per Alexa. Per gentile concessione di Amazon

(rp)