Skip to main content
Stephanie Arnett/MIT Technology Review

Il nuovo agente AI generale cinese ha subito alcuni crash di sistema e un sovraccarico dei server, ma è molto intuitivo e promette bene per il futuro degli aiutanti AI.

Da quando è stato lanciato la scorsa settimana, l’agente generale di intelligenza artificiale Manus si è diffuso online a macchia d’olio. E non solo in Cina, dove è stato sviluppato dalla startup Butterfly Effect di Wuhan. Si è fatto strada nella conversazione globale, con voci influenti nel settore tecnologico, tra cui il cofondatore di Twitter Jack Dorsey e il product lead di Hugging Face Victor Mustar, che ne hanno elogiato le prestazioni. Alcuni l’hanno addirittura soprannominato “il secondo DeepSeek “, paragonandolo al precedente modello di intelligenza artificiale che ha colto di sorpresa il settore per le sue capacità inaspettate e per la sua origine.

Manus sostiene di essere il primo agente di IA generale al mondo, che utilizza diversi modelli di IA (come Claude 3.5 Sonnet di Anthropic e versioni perfezionate di Qwen open-source di Alibaba) e diversi agenti che operano in modo indipendente per agire autonomamente su un’ampia gamma di compiti (questo lo differenzia dai chatbot di IA, come DeepSeek, che si basano su un’unica grande famiglia di modelli linguistici e sono progettati principalmente per le interazioni di conversazione). (Questo lo rende diverso dai chatbot AI, tra cui DeepSeek, che si basano su un’unica grande famiglia di modelli linguistici e sono progettati principalmente per le interazioni conversazionali).

Nonostante tutto il clamore, pochissime persone hanno avuto la possibilità di utilizzarlo. Attualmente, meno dell’1% degli utenti in lista d’attesa ha ricevuto un codice di invito. (Non è chiaro quante persone siano in questa lista, ma per avere un’idea di quanto interesse ci sia, il canale Discord di Manus ha più di 186.000 membri).

MIT Technology Review è riuscito a ottenere l’accesso a Manus e, quando l’ho provato, ho scoperto che usarlo è come collaborare con uno stagista altamente intelligente ed efficiente: sebbene a volte non comprenda ciò che gli viene chiesto di fare, faccia ipotesi errate o tagli le curve per accelerare i compiti, spiega chiaramente il suo ragionamento, è notevolmente adattabile e può migliorare sostanzialmente quando gli vengono fornite istruzioni dettagliate o feedback. In definitiva, è promettente ma non perfetto.

Proprio come il precedente prodotto della casa madre, un assistente AI chiamato Monica e rilasciato nel 2023, Manus è destinato a un pubblico globale. L’inglese è impostato come lingua predefinita e il suo design è pulito e minimalista.

Per accedere, l’utente deve inserire un codice di invito valido. Poi il sistema indirizza gli utenti a una pagina di destinazione che ricorda da vicino quelle di ChatGPT o DeepSeek, con le sessioni precedenti visualizzate in una colonna a sinistra e una casella di input per la chat al centro. La pagina di destinazione presenta anche esempi di attività curate dall’azienda, che vanno dallo sviluppo di strategie aziendali all’apprendimento interattivo, fino a sessioni di meditazione audio personalizzate.

Come altri strumenti di intelligenza artificiale basati sul ragionamento, come ChatGPT DeepResearch, Manus è in grado di suddividere i compiti in fasi e di navigare autonomamente sul web per ottenere le informazioni necessarie a completarli. Ciò che lo distingue è la finestra “Manus’s Computer”, che consente agli utenti non solo di osservare ciò che l’agente sta facendo, ma anche di intervenire in qualsiasi momento.

Per metterlo alla prova, ho dato a Manus tre incarichi: (1) compilare un elenco di giornalisti di rilievo che si occupano di tecnologia in Cina, (2) cercare annunci immobiliari con due camere da letto a New York e (3) nominare potenziali candidati per Innovators Under 35, un elenco creato ogni anno da MIT Technology Review.

Ecco come è andata:

Compito 1: Il primo elenco di giornalisti che Manus mi ha dato conteneva solo cinque nomi, con cinque “menzioni d’onore” sotto di essi. Ho notato che elencava il lavoro notevole di alcuni giornalisti, ma non lo faceva per altri. Ho chiesto a Manus perché. La ragione che mi ha offerto è stata di una semplicità esilarante: È diventato pigro. È stato “in parte dovuto a vincoli di tempo, perché ho cercato di accelerare il processo di ricerca”, mi ha detto l’agente. Quando ho insistito sulla coerenza e sulla completezza, Manus ha risposto con un elenco completo di 30 giornalisti, indicando il loro attuale sbocco ed elencando i lavori più importanti. (Sono stata felice di vedere che sono stata selezionata, insieme a molti dei miei amati colleghi).

Mi ha colpito il fatto che ho potuto suggerire modifiche di alto livello, proprio come farei con uno stagista o un assistente in carne e ossa, e che il sistema ha risposto in modo appropriato. Inoltre, se inizialmente non aveva notato i cambiamenti nello status di datore di lavoro di alcuni giornalisti, quando gli ho chiesto di rivedere alcuni risultati, li ha corretti rapidamente. Un’altra caratteristica interessante: il risultato era scaricabile come file Word o Excel, per cui era facile modificarlo o condividerlo con altri.

Manus si è però scontrato con un ostacolo quando si accedeva agli articoli dei giornalisti dietro i paywall; si è spesso imbattuto in blocchi captcha. Dato che ho potuto seguire passo dopo passo, ho potuto facilmente sostituirlo per completarlo, anche se molti siti di media hanno bloccato lo strumento, citando attività sospette. Vedo un potenziale di miglioramento in questo senso, e sarebbe utile se una versione futura di Manus potesse chiedere aiuto in modo proattivo quando incontra questo tipo di restrizioni.

Compito 2: per la ricerca dell’appartamento, ho fornito a Manus una serie complessa di criteri, tra cui un budget e diversi parametri: una cucina spaziosa, uno spazio esterno, l’accesso al centro di Manhattan e una stazione ferroviaria principale a sette minuti a piedi. Inizialmente Manus ha interpretato in modo troppo letterale requisiti vaghi come “qualche tipo di spazio esterno”, escludendo completamente le proprietà senza terrazza privata o accesso al balcone. Tuttavia, dopo ulteriori indicazioni e chiarimenti, è stato in grado di compilare un elenco più ampio e utile, fornendo raccomandazioni in livelli e punti ordinati.

L’output finale sembrava direttamente da Wirecutter, con sottotitoli come “migliore in assoluto”, “migliore valore” e “opzione di lusso”. Questo compito (compreso il tira e molla) ha richiesto meno di mezz’ora, molto meno tempo rispetto alla compilazione dell’elenco dei giornalisti (che ha richiesto poco più di un’ora), probabilmente perché gli annunci immobiliari sono più disponibili e ben strutturati online.

Compito 3: è stato il più grande in termini di portata: ho chiesto a Manus di nominare 50 persone per l’elenco degli Innovatori Under 35 di quest’anno. Produrre questo elenco è un’impresa enorme e di solito riceviamo centinaia di candidature ogni anno. Ero quindi curiosa di vedere quanto Manus fosse in grado di fare. Manus ha suddiviso il compito in fasi, tra cui l’analisi degli elenchi precedenti per comprendere i criteri di selezione, la creazione di una strategia di ricerca per individuare i candidati, la compilazione dei nomi e la garanzia di una selezione diversificata di candidati provenienti da tutto il mondo.

Lo sviluppo di una strategia di ricerca è stata la parte che ha richiesto più tempo a Manus. Pur non delineando esplicitamente il suo approccio, la finestra Computer di Manus ha mostrato l’agente che scorreva rapidamente i siti web di prestigiose università di ricerca, annunci di premi tecnologici e articoli di cronaca. Tuttavia, ha nuovamente incontrato ostacoli quando ha cercato di accedere a documenti accademici e a contenuti multimediali a pagamento.

Dopo tre ore di ricerca su Internet – durante le quali Manus mi ha chiesto (comprensibilmente) più volte se potevo restringere la ricerca – è stato in grado di fornirmi solo tre candidati con profili completi. Quando l’ho sollecitato nuovamente a fornire un elenco completo di 50 nomi, alla fine ne ha generato uno, ma alcune istituzioni e settori accademici erano fortemente sovrarappresentati, a testimonianza di un processo di ricerca incompleto. Dopo aver fatto notare il problema e aver chiesto di trovare cinque candidati cinesi, è riuscito a compilare una solida lista di cinque nomi, anche se i risultati si sono orientati verso i beniamini dei media cinesi. Alla fine ho dovuto rinunciare, dopo che il sistema ha avvertito che le prestazioni di Manus avrebbero potuto diminuire se avessi continuato a inserire troppo testo.

La mia valutazione: Nel complesso, ho trovato Manus uno strumento molto intuitivo, adatto a utenti con o senza background di codifica. In due dei tre compiti ha fornito risultati migliori rispetto a ChatGPT DeepResearch, anche se ha richiesto molto più tempo per completarli. Manus sembra più adatto a compiti analitici che richiedono una ricerca approfondita su Internet, ma che hanno una portata limitata. In altre parole, è meglio attenersi al tipo di attività che uno stagista umano esperto potrebbe svolgere durante una giornata di lavoro.

Tuttavia, non è tutto liscio come l’olio. Manus può subire frequenti arresti anomali e instabilità del sistema e può avere difficoltà quando gli viene chiesto di elaborare grandi quantità di testo. Il messaggio “A causa dell’elevato carico del servizio, non è possibile creare attività. Riprovare tra qualche minuto” è apparso alcune volte sul mio schermo quando ho cercato di avviare nuove richieste.

Ha un tasso di fallimento più elevato rispetto a ChatGPT DeepResearch, un problema che il team sta affrontando, secondo il capo scienziato di Manus, Peak Ji. Detto questo, il media cinese 36Kr riporta che il costo per attività di Manus è di circa 2 dollari, un decimo del costo di DeepResearch. Se il team di Manus rafforza la sua infrastruttura di server, vedo che lo strumento diventerà la scelta preferita degli utenti individuali, in particolare dei colletti bianchi, degli sviluppatori indipendenti e dei piccoli team.

Infine, ritengo davvero prezioso il fatto che il processo di lavoro di Manus sia relativamente trasparente e collaborativo. Fa attivamente domande lungo il percorso e conserva le istruzioni chiave come “conoscenza” nella sua memoria per un uso futuro, consentendo un’esperienza agenziale facilmente personalizzabile. È anche molto bello che ogni sessione sia rigiocabile e condivisibile.

Mi aspetto di continuare a usare Manus per ogni tipo di attività, sia nella vita privata che in quella professionale. Anche se non sono sicuro che il paragone con DeepSeek sia del tutto azzeccato, è un’ulteriore prova del fatto che le aziende cinesi di IA non si limitano a seguire le orme delle loro controparti occidentali. Piuttosto che limitarsi a innovare i modelli di base, stanno dando forma attiva all’adozione di agenti di IA autonomi a modo loro.