Skip to main content

Le ultime app ripropongono l’intimità della parola parlata, ma ci sono seri problemi di controllo della sicurezza degli utenti da affrontare per evitare eccessi.

di Tanya Basu

Ogni mattina, mentre Nandita Mohan passa al setaccio le sue e-mail, i suoi amici del college le parlano all’orecchio, raccontando la loro giornata, ricordando, riflettendo su cosa significhi prendere un diploma in tempi di pandemia. Mohan, una programmatrice di software di 23 anni nella Bay Area, non è al telefono, né sta ascoltando un podcast, ma sta utilizzando Cappuccino, un’app che raccoglie le registrazioni vocali da un gruppo di amici o familiari e le fornisce come audio scaricabile.

La messaggistica audio è disponibile da anni. I memo vocali su WhatsApp sono particolarmente diffusi in India e i messaggi audio di WeChat sono popolari in Cina. Durante la pandemia, queste funzionalità sono diventate il modo più semplice per rimanere in contatto evitando Zoom. Ora, una nuova ondata di app alla moda sta incorporando l’immediatezza e la crudezza dell’audio nell’esperienza di base, restituendo nuovo vigore alla comunicazione vocale. Dalle telefonate alla messaggistica e di nuovo all’audio, il modo in cui utilizziamo i nostri telefoni potrebbe chiudere il cerchio.

I nuovi arrivati

La rete più nota incentrata sull’audio è Clubhouse, la vivace app solo su invito che ha debuttato la scorsa primavera con recensioni entusiastiche per la vicinanza a un talk show nelle chat room del primo Internet. Utilizzarla è come partecipare a una conversazione di gruppo online. Ma la promessa di Clubhouse è stata infranta dalla sua mancanza di moderazione e dal chiacchiericcio sfrenato di venture capital misogini. La giornalista del “New York Times” Taylor Lorenz, un tempo fan dell’app, è stata oggetto di molestie durante le sessioni del Clubhouse per aver denunciato il comportamento di un VC. (Si veda tweet)

“Non ho intenzione di tornare sull’app”, ha detto Lorenz a “Wired”. “Non voglio supportare alcuna rete che non prenda sul serio la sicurezza degli utenti.” La sua esperienza non è stata una tantum e da allora sono apparsi elementi più oscuri e a sfondo razzista. Sembra che i comportamenti che minano alla base ogni altra piattaforma sociale siano presenti anche dietro la patina esclusiva di Clubhouse.

L’app di chat di gioco Discord, nel frattempo, è esplosa in popolarità. Il servizio utilizza un software Voice-over-IP per tradurre la chat parlata in testo (un’idea che è venuta dai videogiocatori che non potevano digitare durante il gioco). A giugno, per venire incontro alla necessità di connessione delle persone durante la pandemia, Discord ha annunciato un nuovo slogan – “Il tuo posto per parlare” – e ha iniziato a cercare di allargare il pubblico. Il marketing sembra aver funzionato: a ottobre Discord ha registrato 6,7 milioni di utenti, in  aumento rispetto agli 1,4 milioni di febbraio, poco prima della pandemia.

Ma mentre le comunità di Discord, o “server”, possono essere piccole e innocenti come i bambini che organizzano pigiama party a distanza, hanno visto anche la presenza di estremisti di estrema destra che hanno utilizzato il servizio per organizzare il raduno dei suprematisti bianchi di Charlottesville e la recente insurrezione al Campidoglio degli Stati Uniti.

Sia in Discord che in Clubhouse, la cultura del gruppo – giocatori nerd nel caso di Discord, venture capitalist troppo “estroversi” in Clubhouse – ha portato a forme di pensiero collettivo che possono essere scoraggianti nel migliore dei casi e bigotti nel peggiore. Eppure c’è innegabilmente una componente di forte fascino. Non è bello parlare ed essere ascoltati? Dopo tutto, questa è la promessa fondamentale dei social media: la democratizzazione della voce.

Parla e sarai ascoltato

L’intimità della voce rende i social media audio molto più attraenti nell’era del distanziamento sociale. Jimi Tele, CEO di Chekmate, un’app di appuntamenti “senza testo” che collega gli utenti tramite voce e video, afferma di voler lanciare un’app che sia a prova di chi vuole ingannare gli altri online con falsi profili. “Volevamo abbandonare l’anonimato e la “gamificazione” tipici dai messaggi di testo e creare invece una comunità radicata nell’autenticità, in cui gli utenti sono incoraggiati a essere se stessi senza pregiudizi”, afferma Tele. 

Gli utenti dell’app iniziano con memo vocali che durano in media cinque secondi e poi diventano progressivamente più lunghi. Mentre Chekmate ha un’opzione video, Tele afferma che diverse migliaia di utenti dell’app preferiscono senza alcun dubbio usare solo le loro voci. “Sono percepite come meno ‘minacciose’ dei messaggi video”, egli dice.

Questa immediatezza e autenticità è il motivo per cui Gilles Poupardin ha creato Cappuccino. Si chiedeva perché non esistesse già un prodotto che raccogliesse memo vocali in un unico file scaricabile. “Tutti hanno una chat di gruppo con gli amici”, egli spiega,  “ma se gli altri si potessero ascoltare, l’effetto sarebbe molto più potente”.

Mohan è d’accordo. Dice che il suo gruppo di amici è passato a Cappuccino da un gruppo di chat di Facebook Messenger e poi si è trasferito su Zoom all’inizio della pandemia. Le discussioni si sono trasformate in un confronto sui grandi eventi. “Non c’era tempo per i dettagli”, si lamenta. I “beans” quotidiani di Cappuccino, come vengono chiamate le registrazioni cucite insieme, permettono al cerchio di amici di Mohan di tenersi aggiornato, mantenendo un alto livello di intimità. “La mia unica amica si sta trasferendo in un nuovo appartamento in una nuova città, e mi ha parlato di come prepara il caffè in cucina”, egli racconta. “Questo è qualcosa che non sarebbe mai successo in una chiamata Zoom, perché sembra qualcosa di insignificante”.

Anche le società di social media tradizionali stanno entrando in azione. Nell’estate del 2020 Twitter ha lanciato i tweet vocali – 140 secondi di audio – in una funzionalità chiamata Spaces. “Volevamo capire se l’audio potesse aggiungere un ulteriore livello di connessione alla conversazione pubblica”, afferma Rémy Bourgoin, ingegnere informatico senior del team di tweet vocali di Twitter e di Spaces. (Si veda tweet)

Bourgoin afferma che Spaces ricorda “l’ambiente intimo e confortevole di una cena ben organizzata, in cui non è necessario conoscere tutti i presenti per divertirsi, ma ci si sente a proprio agio seduti al tavolo”. (Si veda tweet)


Si potrebbe sbuffare increduli leggendo che Twitter vuole creare uno spazio che sia “confortevole” e “intimo”. Dopotutto, Twitter non ha esattamente un track record stellare nella creazione di un ambiente online che sia accogliente e protegga gli utenti vulnerabili dagli abusi.  Bourgoin afferma che il gruppo si sta muovendo lentamente di proposito prima di rilasciare Spaces oltre la versione beta per poter inserire anche i sottotitoli, una rara funzionalità di accessibilità nelle reti audio. 

Il limite

La moderazione dei contenuti nell’audio è molto più difficile che nel testo. Testo ricercabile e automoderatori sono stati utilizzati con un certo successo, ma i moderatori umani sembrano essere il modo più efficace per bloccare le persone che non rispettano le regole della comunità, mettendo a rischio la salute psicologica delle persone. Nel caso di piattaforme in cui le persone possono entrare in qualsiasi momento e chattare, la “democratizzazione” dell’accesso rende l’audio attraente, ma rappresenta un incubo per chi modera. 

“Questa è sicuramente una sfida enorme con qualsiasi piattaforma generata dagli utenti”, afferma Austin Petersmith, che ha lanciato Capiche.fm in versione beta lo scorso anno. Il sito è nato da una comunità di software che ricorda un programma radiofonico a chiamata, in cui gli ospiti invitano gli ascoltatori a intervenire mentre sono “in onda”. 

Come hanno ben capito gli utenti di Clubhouse, gli spazi solo vocali possono diventare rapidamente un luogo spiacevole, come ogni altro su Internet. È improbabile che le persone che già soffrono di abusi online e fasce più emarginate vogliano mettersi in una situazione così difficile da tenere sotto controllo. C’è anche motivo di credere che queste piattaforme più recenti e meno regolamentate saranno attraenti per estremisti di estrema destra, cospirazionisti  e  sostenitori di QAnon, che  stanno creando le proprie reti di podcast.

Tuttavia, i social network audio sembrano offrire qualcosa che i social media tradizionali non possono. Uno dei principali vantaggi del formato è il modo in cui offre agli utenti la connessione immediata di una chiamata vocale o video, ma alle loro condizioni. Le telefonate e le chiamate Zoom richiedono una pianificazione mentre i contenuti audio dei social media possono essere creati a proprio piacimento in un modo che gli avvisi di notizie, le notifiche e il doomscrolling non consentono. 


Come dice Mohan di Cappuccino, che ascolta i suoi amici ogni mattina: “Mi coinvolge e mi costringe ad ascoltare con più attenzione cosa mi viene detto. Prendo persino appunti sulle cose a cui voglio rispondere. Ogni giorno, nel bel mezzo della mia giornata lavorativa, registro il mio messaggio e mi sembra di stare insieme ai miei amici”.

Immagine: Ms Tech / Pexels