Benvenuti all’università dei robot

Se si vuole che un robot impari un nuovo compito, lo si può collegare a RoboNet, un vasto database di video che può insegnargli qualsiasi cosa.

di ArXiv

Uno degli eroi non celebrati della rivoluzione dell’IA è un database poco noto chiamato ImageNet. Creata dai ricercatori dell’Università di Princeton, ImageNet contiene circa 14 milioni di immagini, ciascuna provvista di un testo stilato in crowdsourcing che spiega il contenuto dell’immagine.

ImageNet è importante perché è il database su cui molte delle potenti reti neurali odierne si addestrano. Le reti neurali apprendono guardando le immagini e il testo di accompagnamento: più grande è il database, migliore è l’apprendimento. Senza ImageNet e altri insiemi di dati visivi simili, anche le reti neurali più potenti non sarebbero in grado di riconoscere nulla.

Ora gli esperti di robotica affermano di voler replicare questo approccio con i video per insegnare come si può interagire con l’ambiente. Sudeep Dasari dell’Università della California, a Berkeley, sta creando un database chiamato RoboNet, costituito da dati video annotati di robot in azione.

Per esempio, i dati potrebbero includere numerosi casi di un robot che sposta una tazza su un tavolo. L’idea è che chiunque possa scaricare questi dati e utilizzarli per addestrare la rete neurale di un robot a spostare una tazza, anche se non ha mai interagito prima con questo oggetto.

Dasari e colleghi sperano di mettere a disposizione un prodotto in grado pre-addestrare quasi tutti i robot per fare quasi qualsiasi compito, una sorta di università robotica, che il team chiama RoboNet.

Apprendimento robotico.AP

Fino ad ora, la robotica non ha avuto grande successo nell’insegnare ai robot a navigare e a interagire con l’ambiente. Dasari utilizza la tecnica standard di apprendimento automatico che ImageNet ha contribuito a diffondere. I ricercatori iniziano registrando il modo in cui un robot interagisce, per esempio, con un pennello per spostarlo su una superficie. Quindi registrano più video del suo movimento e usano i dati per addestrare una rete neurale sul modo migliore per eseguire l’azione.

Il trucco, ovviamente, è avere a disposizione molti dati, vale a dire innumerevoli ore di video di materiale. Una volta che un robot ha imparato a muovere il pennello, deve passare attraverso la stessa procedura di apprendimento per spostare quasi tutto il resto, che si tratti di un cucchiaio o un paio di occhiali. Se l’ambiente cambia, questi sistemi di apprendimento devono generalmente ricominciare dall’inizio.

“La pratica comune di raccogliere di nuovo i dati da zero per ogni nuovo ambiente significa essenzialmente dover apprendere una seconda volta le conoscenze di base sul mondo: uno sforzo inutile”, afferma Dasari.

RoboNet aggira questo problema, in quanto è un database aperto per la condivisione di esperienze robotiche, in cui ogni robot può imparare dall’esperienza di un altro.

Per avviare il database, il team ha già registrato circa 15 milioni di fotogrammi video di attività utilizzando sette diversi tipi di robot con pinze diverse in una varietà di ambienti.

Dasari utilizza questo database per pre-addestrare i robot per attività che non avevano mai tentato prima. Il team sostiene che i robot addestrati con questo approccio hanno prestazioni migliori di quelli che sono stati formati in modo convenzionale su un numero ancora maggiore di dati.

Si tratta di un lavoro impressionante che possiede un potenziale significativo. “E’ il primo passo verso la creazione di agenti robotici in grado di operare in una vasta gamma di ambienti e su hardware diverso”, afferma il team.

Certo, ci sono sfide significative da affrontare. Per esempio, i ricercatori devono capire come utilizzare al meglio i dati. “Speriamo che RoboNet induca gli esperti di robotica e apprendimento del rinforzo a indagare su come ridimensionare gli algoritmi di apprendimento del rinforzo per soddisfare la complessità del mondo reale”, afferma Dasari.

Il risultato è comunque sorprendente: una sorta di università robotica in grado di fornire a qualsiasi robot le competenze necessarie per apprendere. ImageNet è stato un fattore chiave nel rendere il sistema di visione della macchina buono quanto quello degli umani nel riconoscere gli oggetti. Se RoboNet avrà solo la metà del successo, sarà un passo avanti decisivo.

Immagine: Getty Images

(rp)

Related Posts
Total
0
Share