Ricerca in tempo reale nella Rete

Le reti sociali stanno cambiando il modo di cercare l’informazione

di Nicholas Carr

Come si estrae l’informazione testuale da un tweet? Cinque anni fa, una domanda del genere non avrebbe avuto senso. Oggi è del tutto ragionevole e Amit Singhal sta cercando di rispondervi. Singhal è il responsabile della ricerca di Google: il suo obiettivo è incorporare nuovi dati nei risultati di ricerca in tempo reale rintracciando e assegnando un valore agli aggiornamenti dei contenuti on line, particolarmente alle migliaia di messaggi che scorrono nelle reti sociali ogni secondo.

La ricerca in tempo reale è una risposta a un cambiamento fondamentale nel modo in cui le persone utilizzano il Web. Gli utenti in genere visitano una pagina, cliccano su un link e visitano un’altra pagina. Passano così molto tempo a controllare flussi di dati – tweets, aggiornamenti di status, titoli di testa – provenienti da sistemi di servizi come Facebook e Twitter e da blog e altri punti informativi.

Le «pepite» dell’informazione effimera sono la moneta corrente del Web e setacciarle alla ricerca di dati utili rappresenta una sfida impegnativa per i motori di ricerca. L’aspetto più scoraggiante, secondo Singhal, è costituito dal fallimento nella raccolta dell’informazione. Facebook e Twitter sono ben contenti di vendere l’accesso ai loro feeds di dati – o fire hoses (idranti antincendio) come sono chiamati da questi siti sociali – direttamente ai provider di ricerca; l’informazione arriva immediatamente ai computer di Google.

Ciò che è realmente difficile da capire sulla ricerca in tempo reale rimane il significato e il valore di questi frammenti itineranti di informazione. La difficoltà non si limita alla eliminazione dello spam, che in ogni caso non è un lavoro trascurabile. Gli utenti che utilizzano dati in tempo reale pretendono la stessa qualità, credibilità e rilevanza dei sistemi tradizionali di ricerca in Rete. Nessuno vuole bere attaccandosi direttamente a un «idrante».

Google domina il campo della ricerca tradizionale, stabilendo meticolosamente collegamenti a una pagina e tenendo conto di una serie di segnali relativi al suo valore, che si vanno accumulando nel tempo. Ma questo sistema non funziona per la ricerca in tempo reale. I messaggi dei siti sociali possono perdere di valore entro pochi minuti dalla loro scrittura. Google deve valutare la loro importanza in qualche secondo o addirittura microsecondo.

Google non ama parlare dei suoi algoritmi di ricerca, ma Singhal illustra una serie di variabili che l’azienda utilizza per analizzare le cosiddette «chiacchiere». Alcune sono semplici. Un utente di Twitter che ha molti contatti e i cui tweets vengono spesso reindirizzati ad altri utenti è in genere considerato una fonte credibile. Allo stesso modo, gli utenti di Facebook acquisiscono una discreta «autorità se hanno più amicizie e ancora più se i loro amici sono in contatto con molti altri amici.

Altre variabili sono più complesse. Un picco di presenze improvviso di una parola in un flusso di messaggi – per esempio, terremoto – potrebbe indicare un evento importante. Se un messaggio su un normale argomento di discussione presenta frasi insolite, potrebbe segnalare qualche novità. Google, spiega Singhal, monitora continuamente i cambiamenti di linguaggio e le altre deviazioni rispetto al comportamento tradizionale.

L’azienda è impegnata anche a stabilire collegamenti tra il contenuto del messaggio e i dati di posizionamento trasmessi dai telefoni intelligenti e dai computer mobili o dai servizi forniti da siti sociali come Foursquare. L’ubicazione di chi invia un messaggio può giocare un ruolo di grande importanza. Se l’utente che ha spedito il tweet su un terremoto si trova vicino all’epicentro, molto probabilmente i suoi messaggi avranno un valore superiore a quelli di chi scrive da centinaia di chilometri di distanza.

La visione della ricerca in tempo reale di Singhal è decisamente in linea con la strategia di Google: ricavare da una miscellanea di dati i contenuti più rilevanti in quel particolare momento per chi conduce la ricerca. Altri motori di ricerca, tra cui il principale rivale di Google, Microsoft, stanno intraprendendo una strada più radicale.

A Sean Suchter, che dirige il Search Technology Center di Microsoft, a Mountain View, in California, non piace l’espressione «ricerca in tempo reale» perché la considera troppo restrittiva. A suo parere, il motore di ricerca Bing, di Microsoft, non dovrebbe solo filtrare il flusso di dati delle reti sociali, ma diventarne una estensione.

In definitiva, dice Suchter, le conversazioni interpersonali si svolgeranno su Bing, innescate dalle parole chiave inserite dagli utenti. La ricerca in tempo reale, prevede Suchter, sarà talmente differente da ciò che l’ha preceduta, da cancellare i vantaggi della rendita di posizione di Google. «Qui la storia non conta», aggiunge dopo una pausa, «Stiamo per metterli in ginocchio».

Amit Singhal ha già sentito minacce simili e sa che finora non hanno portato a nulla. Ma ammette che la ricerca in tempo reale potrebbe rappresentare «una rottura radicale» nella storia della ricerca. La prova più difficile per Singhal sarà mantenere la supremazia di Google malgrado il dilagare delle «chiacchiere».

Related Posts
Total
0
Share