Adam Coates e il riconoscimento vocale

Ogni anno MIT Technology Review USA seleziona alcuni giovani ricercatori che promettono di apportare significative innovazioni nei rispettivi campi di ricerca. Tra i TR 35 di quest’anno, ne presenteremo ai nostri lettori uno per ognuno dei cinque settori di inquadramento (Inventori, Imprenditori, Visionari, Pionieri, Umanitari). Oggi tocca ai Visionari, con Adam Coates, 33 anni.

di Tom Simonite

Ha inventato sistemi per incrementare la potenza di calcolo dell’apprendimento approfondito. Ora è a capo di un laboratorio che opera nella Silicon Valley per il gigante cinese Baidu. Gli abbiamo chiesto quali siano le condizioni e le prospettive del suo lavoro.

Perché i cinesi hanno creato proprio lì un laboratorio?

Sono molto rapidi nell’avviare nuovi progetti. Ciò è dovuto in parte al dinamismo della Cina, per cui le società tecnologiche devono passare rapidamente dalla carenza di risorse al possesso di qualcosa allo stato dell’arte. La missione del mio laboratorio è creare la tecnologia che impatterà con la vita di almeno 100 milioni di persone; è pensata per muoversi rapidamente, come una start-up.

Stiamo reclutando ricercatori nel campo della Intelligenza Artificiale e diverse persone nella Silicon Valley con grandi competenze nello sviluppo di altri prodotti, le quali non avrebbero mai pensato di essere in grado di contribuire allo sviluppo dell’intelligenza artificiale.

A cosa sta lavorando il suo laboratorio?

La prima tecnologia sulla quale ci stiamo concentrando è il riconoscimento vocale. I touch screen dei telefoni cellulari sono perfetti per alcune funzioniqa, ma veramente terribili per altre ed esiste una grande varietà di prodotti che necessitano disperatamente di una migliore interfaccia. Le persone non ricorrono al riconoscimento vocale, perché non funziona ancora abbastanza bene. Il nostro traguardo è portarlo a un livello tale per cui parlare con il proprio dispositivo risulti facile come parlare con una persona.

A dicembre abbiamo raggiunto la nostra prima pietra miliare con DeepSpeech, un motore vocale che abbiamo costruito rapidamente dal nulla ricorrendo all’apprendimento approfondito. Anche in presenza di rumori di sottofondo consente dei risultati enormemente migliori.

Perché questa tecnologia dovrebbe avere un impatto su 100 milioni di persone?

In economie in rapido sviluppo come quella cinese, molte persone si connetteranno a Internet per la prima volta utilizzando un telefono cellulare. La possibilità di interagire con un dispositivo o ricevere risposte a domande con la facilità con cui si parla con una persona li renderebbe ancora più potenti. Penso che i clienti di Baidu abbiano particolarmente bisogno di fare affidamento su una intelligenza artificiale.

Related Posts
Total
0
Share