SIR TIM BERNERS-LEE

HA CREATO IL WEB. ORA STA LAVORANDO A INTERNET 2.0.

di Mark Frauenfelder

La creazione del World Wide Web non ha reso Tim Berners-Lee immediatamente ricco e famoso. In parte perché il Web nasce da tecnologie relativamente modeste. L’invenzione di Berners-Lee si è basata su un programma per la ricerca dell’informazione chiamato Enquire (dal nome di un libro dell’età vittoriana Enquire Within upon Everything), che egli scrisse nel 1980 quando era programmatore a contratto al CERN di Ginevra, in Svizzera. In parte perché Berners-Lee realizzò l’impensabile quando, dopo oltre un decennio, mise a punto gli strumenti che hanno permesso di definire la struttura base del Web: egli li rese pubblici, con l’approvazione del CERN, senza clausole restrittive. Mentre altri si arricchivano con la sua invenzione, il programmatore dai modi affabili fondò il World Wide Web Consortium (W3C) al MIT, che egli ancora dirige, per promuovere gli standard e lo sviluppo del Web globale. Berners-Lee sta finalmente ottenendo i dovuti riconoscimenti: a luglio del 2004 è stato nominato baronetto dalla regina Elisabetta II e il mese precedente ha ricevuto in Finlandia il premio di un milione di euro del Millennium Technology Prize, che gli è stato assegnato «per eminenti scoperte tecnologiche che, oltre a migliorare direttamente la qualità della vita della persone, sono basate su valori umani e incoraggiano allo stesso tempo lo sviluppo economico sostenibile». Ora nei suoi nuovi uffici al Ray and Maria Stata Center del MIT, progettati da Frank Gehry, il 49enne inglese è alle prese con centinaia di progetti al W3C. Egli è anche personalmente coinvolto nello sviluppo della sua seconda grande idea: la Rete Semantica, che aggiunge targhette identificative all’informazione delle pagine Web e le collega in modo tale che i computer possano scoprire i dati più efficacemente e formare nuove associazioni tra diversi segmenti informativi, creando di fatto una banca dati distribuita globalmente. Anche se faceva parte del progetto iniziale di Berners-Lee, la Rete Semantica è rimasta 15 anni in fase di sviluppo e sulla sua strada ha incontrato una buona dose di scetticismo. Ma Berners-Lee crede che la sua idea avrà presto successo, consentendo ai computer di estrarre significati da informazioni remote con la stessa facilità con cui l’attuale Internet mette in collegamento singoli documenti. La Rete Semantica, insieme ad altre specifiche e strumenti in via di sviluppo a W3C, tra cui standard di accessibilità per persone disabili e software per apparecchi mobili, è parte dell’ambizioso progetto di Berners-Lee di «un Web che esprima un significato condiviso per le singole cose e per tutte le persone». Ma stiamo realmente muovendoci in questa direzione? Malgrado la sua visione ottimistica del futuro, Berners-Lee teme che cambiamenti superficiali dell’organizzazione e della gestione del Web possano comprometterne funzionalità interna e «universalità. Il padre del World Wide Web esterna le sue preoccupazioni – e i suoi sogni – il giorno prima di volare a Helsinki per ricevere il Millennium Technology Prize.

Da diversi anni Lei sta promuovendo la cosiddetta Rete Semantica, ma l’accoglienza non sembra entusiastica. Perché?

Non è la prima volta che ho questo tipo di problemi con un cambiamento di paradigma. All’inizio le persone non capivano assolutamente cosa ci fosse di stimolante nel Web. Esse vedevano le cose su piccola scala e non erano interessate a immaginarle su scala più grande. Lo stesso meccanismo si sta ripetendo con la Rete Semantica.

Come pensa di superare questo tipo di ostacolo?

Al momento abbiamo iniziato a mettere le applicazioni sulla Rete Semantica una per volta, collegandole dove sembra utile. Ma l’aspetto più sorprendente è l’effetto di rete. L’idea è di dare vita a una massa critica in cui ogni elemento è in stretto collegamento con un complesso inimmaginabile di altri dati. Allora l’incentivo ad aggiungere altre informazioni cresce esponenzialmente al pari del valore dei dati esterni a disposizione. Poiché in una prima fase poche persone mostreranno entusiasmo per la connessione di enormi masse di dati della Rete Semantica, queste operazioni verranno effettuate da chi crede in questo progetto, da chi comprende l’importanza di far partire questa iniziativa.

Ma perché vale la pena di fare tutto ciò?

L’elemento centrale della Rete Semantica è che esiste una grande quantità di informazione – finanziaria, industriale, meteo – su banche dati, fogli elettronici e siti Web che possiamo leggere, ma non manipolare. Il fattore chiave è che questi dati esistono, ma i computer non lo sanno e non riescono a metterli insieme. Non siamo in grado di scrivere programmi per usarli. Invece, con una rete di dati semantici correlati globalmente, si potranno combinare le informazioni già note con altre di cui non si sapeva nulla. Le nostre vite saranno arricchite da queste informazioni alle quali in precedenza non avevamo accesso; saremo finalmente in grado di scrivere programmi che ci aiuteranno concretamente perché ci consentiranno di comprendere i dati esterni, senza limitarsi a presentarceli su uno schermo.

Come fa la Rete Semantica a capire i dati?

Immagini che l’utente si colleghi in rete e trovi la pubblicità di un seminario al quale decide di andare. Su quella pagina pubblicitaria ci sono diversi tipi informazione a lui accessibili, ma di cui il computer non sa nulla. L’utente è allora costretto a trasferire la data nella sua agenda e poi aggiungere una nuova voce all’indirizzario con i nomi delle persone che partecipano al seminario. Infine, per non lasciare nulla al caso, cerca la latitudine e la longitudine del seminario e le inserisce nel suo apparecchio GPS per avere un’idea precisa del luogo dell’incontro. è abbastanza complesso fare tutto ciò a mano. Sarebbe molto più semplice dire al computer: «Vorrei partecipare a questo seminario». Se ci fosse una versione di questa pagina sulla Rete Semantica, avrebbe etichettato l’informazione nella categoria che il computer definerebbe «questo è un evento», con relativa data e orario. Avrebbe anche aggiunto automaticamente l’appuntamento in agenda e i nomi dei partecipanti all’indirizzario e programmato il GPS dell’utente per indicare la strada da seguire. Il sistema potrebbe anche essere in possesso di una serie di informazioni sul rapporto tra l’evento e le diverse persone che lo presiedono; inoltre queste persone potrebbero avere pagine personali sulla Rete Semantica che spiegano come si possa entrare in contatto con loro. L’indirizzario dell’utente non sarebbe più un semplice deposito di dati privati, ma una panoramica di informazioni personalizzate su scala globale.

La Rete Semantica si limita quindi ad automatizzare il lavoro che svolge un assistente umano?

No. Un assistente umano usa una forma di intelligenza che non vogliamo riproporre in questa sede. L’assistente umano avrà la stessa capacità mentale dell’uomo nel correlare l’informazione all’intero spettro della sua esperienza. «Ti ho prenotato direttamente Tiawicha perché c’è il festival dei fiori questo fine settimana e credo … insomma, che possa piacerti!» è una forma di pensiero tipicamente umana. Ciò assomiglia più a un programma che può fare tutte le cose che il dipartimento del MIS (machine instructions set, insieme di istruzioni macchina) potrebbe inserire in un programma, ma che non ha il tempo di realizzare. Ma rimane pur sempre un programma. Così come il World Wide Web è ancora un documento. In futuro la Rete Semantica sarà il luogo ideale per sviluppare l’intelligenza artificiale in modo approfondito. Ma al momento stiamo facendo qualcosa di prevalentemente meccanico, anche se usiamo bit e parti meccaniche sviluppati dalla comunità AI nel corso degli anni.

Sembra un’impresa quasi impossibile. Come funziona la tecnologia?

La tecnologia della Rete Semantica affronta il problema in due fasi diverse. La più banale è il formato comune dei dati. Si possono prendere banche dati, indirizzari, estratti conto, previsioni del tempo – in pratica qualsiasi documento contenga dati reali – e farli trascrivere meccanicamente nel linguaggio base della Rete Semantica, invece che in qualche tipo di formato proprietario o specifico dell’applicazione. Ciò risolve il problema «sintattico».

Ma rimane ancora da risolvere il nodo «semantico». A tal fine la Rete Semantica attribuisce un nome ai concetti fondamentali coinvolti nei dati: data e ora, un evento, un assegno, una transazione, temperatura e pressione, luogo. La loro definizione è legata al loro significato all’interno del sistema che produce i dati: per esempio, «data della transazione che risulta dall’estratto conto» e così via. Questo raggruppamento di concetti è chiamato ontologia. Poi, quando esistono connessioni tra ontologie, come nel caso della data e dell’ora di una fotografia che corrispondono a quelle di un bollettino meteorologico, noi definiamo regole per sfruttare questi collegamenti. Ciò consente all’utente, per esempio, di richiedere all’agente della Rete Semantica fotografie scattate durante una giornata assolata. Bit dopo bit, collegamento dopo collegamento, i dati diventano sempre più intrecciati e connessi. L’aspetto più interessante consiste nel poter riutilizzare i dati in combinazioni inattese: una persona inserisce i dati per una ragione e un’altra persona li usa per finalità completamente diverse.

Lei ha detto che la «prima fase» della Rete Semantica è conclusa. Potrebbe chiarire meglio cosa voleva dire?

La Rete Semantica funziona definendo nuovi linguaggi per lo scambio di informazioni tra computer. La prima fase è stata quella di portare questi linguaggi di base, dal punto di vista sintattico e semantico, allo stato di standard per i membri del W3C. In effetti l’interoperabilità è l’elemento chiave: un’applicazione non può essere definita di Rete Semantica se il programma si limita a utilizzare i propri formati di dati senza riuscire a scambiare informazioni con altri programmi. Con la nostra rete chi vuole creare una nuova applicazione e pubblicare dati può farlo e il programma di qualsiasi altro utente potrà leggere i dati.

Che tipo di applicazioni di Rete Semantica sono in preparazione per la seconda fase?

C’è grande fermento nelle scienze naturali. Vincere la sfida contro malattie come l’AIDS e il cancro o scoprire farmaci per i nuovi virus richiedono l’interazione di enormi quantità di dati provenienti dai settori più svariati: genomica, proteomica, epidemiologia e così via. Alcuni di questi dati sono pubblici, altri di proprietà delle aziende farmaceutiche e altri ancora privati. L’idea della Rete Semantica di introdurre l’interoperabilità tra i diversi campi è di difficile attuazione, ma promette vantaggi di lunga portata.

Ma è solo un problema di scambio di dati tra settori diversi?

No. Esistono anche difficoltà nel mantenere la privacy e il rispetto della proprietà intellettuale mentre si sta utilizzando l’informazione. Per esempio, nella ricerca di un nuovo farmaco si potrebbero unire i dati epidemiologici con fattori esterni quali le condizioni atmosferiche, i viaggi, le statistiche demografiche per comprendere come si trasmette una malattia e che tipo di persone sono predisposte ad ammalarsi. Il passo successivo sarebbe connettere queste informazioni ai tratti genetici e chiedersi quali proteine vi sono associate e cosa permettono o bloccano nella biologia della cellula umana. Infine si potrebbero collegare le sostanze chimiche coinvolte in queste vie biologiche ai sintomi delle malattie e anche a possibili sostanze chimiche da usare come farmaco. Le potenzialità sono enormi; per questa ragione molte persone sono entusiaste di condurre ricerche di scienze naturali con le applicazioni della Rete Semantica.

C’è un’applicazione esistente che mostra come la Rete Semantica permette di formare queste connessioni?

Se si vuole mettere alla prova la Rete Semantica, si può creare un file friend-of-a-friend. In un file FOAF (i dati componenti una home page personale, formattata in un modo standardizzato) si possono diffondere materiali su tutto ciò che ci riguarda da vicino: fotografie, notizie personali, luoghi preferiti. Si può anche inserire un puntatore che dice «questa è una mia fotografia» e altri particolari riguardanti la foto, come chi sono le altre persone che vi appaiono. Per creare un file FOAF è necessario riempire un modulo, che si trova su www.ldodds.com/foaf/foaf-a-matic.html. Con questa informazione viene generato un file di testo leggibile dalla Rete Semantica che può essere aggiunto al sito Web personale. Ci sono siti Web semantici che utilizzano questi dati per offrire, per esempio, una lista di fotografie che vi collegano con chiunque altro. Io ho tre fotografie con Frank Sinatra perché sono stato fotografato con Bill Clinton che era stato fotografato con uno dei Kennedy che a sua volta era stato fotografato con Frank Sinatra. è un’applicazione abbastanza frivola, ma mostra perfettamente cosa si può ottenere riutilizzando l’informazione.

Può fare un esempio di un uso dell’informazione più sofisticato?è sorprendente vedere come l’industria sia impegnata a migliorare questi standard. Toolkit di HP e IBM, applicazioni per autore di Adobe, soluzioni di gestione di contenuti avanzati di Profium e Brandsoft e motori di ricerca di Network Inference stanno tutti contribuendo a creare una Rete Semantica a diversi livelli. Queste e altre tecnologie vengono adottate da comunità che saranno indotte a rivoluzionare il loro modo di collaborare e comunicare. Ciò è quanto sta avvenendo nel mondo delle scienze naturali, come già abbiamo accennato in precedenza.

In Inghilterra, il Semantic Web Environmental Directory è un prototipo di un nuovo tipo di elenco di organizzazioni e progetti ambientali. Invece di centralizzare la memoria, la gestione e la proprietà dell’informazione, SWED raccoglie semplicemente i dati e li usa per creare la directory. Da una prospettiva sociale, esiste un’applicazione soprannominata Fatcats di FoafCorp (un progetto di Rete Semantica che estende il formato friend-of-a-friend alle entità aziendali) che consente di selezionare un’azienda e di vedere chi partecipa al suo consiglio d’amministrazione, mostrando un grafico delle persone in qualche modo collegate. Se si clicca su una di queste persone, il programma elenca tutti i consigli d’amministrazione di cui fanno parte. è un buon sistema per farsi un’idea delle sfere di influenza delle aziende americane.

L’aspetto più interessante è quando si scopre che una di queste persone è collegata a un file FOAF: allora si passa dalla storia aziendale a quella personale e poi alle fotografie, alle informazioni meteo, alla prenotazione di voli e ristoranti e alla scelta del vino per la cena.

Lei parla spesso dell’importanza dell’«universalità del Web». Cosa vuol dire esattamente?

Una delle proprietà fondamentali del Web è che è solo uno spazio, uno spazio consensuale tra l’altro, che dovrebbe essere indipendente dall’hardware che si usa. Dovrebbe essere indipendente anche dal software o dal sistema operativo. Dovrebbe essere indipendente dalla cultura di appartenenza dell’utente o dal fatto che si sta scrivendo un importante articolo o si stanno solo prendendo appunti. Dovrebbe essere indipendente dal linguaggio che si usa, dal set di caratteri, dalla forma di scrittura, dal tipo di tastiera. Inoltre le persone dovrebbero avere accesso a questa informazione anche se sono disabili. Al W3C utilizziamo questa definizione: «Un Web per chiunque, dovunque e comunque».

Chi minaccia questa universalità?

è stato proposto di creare un dominio speciale di massimo livello chiamato «.mobi». Tutti i siti Web che lavorano con telefonia mobile dovrebbero essere compresi in questa area; sarebbe in sostanza il luogo dei contenuti Web per gli apparecchi mobili. Ma ciò significherebbe un solo URL, o indirizzo Web, per una determinata cosa. Segregare i contenuti in un recinto .mobi è il modo sbagliato di procedere. Al W3C abbiamo numerosi standard per consentire a un sito web di avere prestazioni ottimali se l’utente si collega a esso da un telefono cellulare o da un grande schermo. Ma ovviamente, se si inserisce un «.mobi» alla fine del nome del dominio, è come dire: «Questo è un luogo speciale per vedere qualcosa sul tuo telefono cellulare».

Cosa ne pensa degli altri domini ad alto livello – .biz, .info, eccetera – che sono stati proposti per alleggerire il dominio dei nomi in .com?

L’aggiunta di nuovi domini di massimo livello non aiuterà. Le persone ricordano i suffissi «www» e «.com», così l’esistenza di .info o .biz non fa altro che confonderle. Significa che devono ricordare l’intera sequenza invece del solo nome tra www e il punto. Inoltre è da mettere in conto un sistema di pagamento per le transazioni finanziarie. Le piccole aziende o i singoli utenti che hanno un dominio possono decidere che, per evitare la confusione, devono acquistare questi altri domini. Il solo affitto annuale contribuisce notevolmente a incrementare il costo di Internet per una famiglia.

C’è un forte contrasto tra le Nazioni Unite e ICANN (Internet Corporation for Assigned Names and Numbers) che amministra e gestisce i nomi di dominio e gli indirizzi Internet. Qual è la sua opinione?

Alcuni paesi sono preoccupati, giustamente, che ICANN si muova sotto il controllo del Dipartimento del Commercio americano. Internet è una bene comune e anche se viene gestita oculatamente da ICANN nell’interesse del mondo intero, c’è la sensazione diffusa in alcuni paesi che il fatto che ICANN sia finanziata dal governo statunitense significhi anche che sia controllata dagli Stati Uniti, e ciò non piace affatto. La mia idea è che questa asimmetria debba essere rimossa sollecitamente. è importante che tutto sia fatto alla luce del sole. Il dato certo, comunque, è che ICANN esiste e funziona e che non va abbandonata all’improvviso. Fare qualcosa che favorisca i diretti interessati in modo equilibrato richiede una considerevole esperienza e una politica di piccoli passi. Forse ICANN dovrebbe avere più finanziamenti dalle Nazioni Unite, ma senza diventare da un giorno all’altro simile a un’organizzazione delle Nazioni Unite. Molta confusione in questa area nasce quando le persone usano l’espressione «governo di Internet». Esse cominciano a parlare dei nomi di dominio, che rappresentano in effetti un’area specifica, e finiscono a discutere di privacy, copyright, riservatezza, termini commerciali e di tutto ciò che riguarda i correnti sistemi legali. Le persone sbagliano a ritenere che ICANN controlli ogni cosa che avviene su Internet. ICANN svolge soltanto un compito molto specifico.

Crede che il World Wide Web rimarrà il suo contributo più importante?

Il mio ruolo deve necessariamente trasformarsi da solitario progettista che ha messo in agitazione l’intera comunità a principale architetto del consenso a W3C. Ritengo comunque che il Web rimarrà il mio contributo più importante, anche se va considerato nel posto giusto al momento giusto. L’errore è pensare che l’opera sia conclusa. La Rete Semantica è solo l’applicazione ai dati di un progetto simile al Web; ci vorranno molti decenni prima di riuscire a dire se abbiamo realmente migliorato il complesso del Web nel suo insieme, se mai sarà possibile.

A parte la Rete Semantica, ha qualche altro sogno o desiderio per il futuro del Web?

Non avete idea quanti! Ho sempre voluto un Web più creativo, un medium più flessibile, con sistemi di annotazioni, redattori e così via. Sono entusiasta dei nuovi apparecchi portatili che si possono usare per il Web, delle tecnologie basate sul riconoscimento vocale e altre cose ancora. Una volta che ci si affida all’idea di fondo del Web, tutto diventa possibile.

BREVE STORIA DEL WEB

1945

Su «Atlantic Monthly» Vannevar Bush, il direttore dello statunitense Office of Scientific Research and Development, descrive il Memex, un congegno ipotetico per collegare documenti su microschede.

1968

Douglas Engelbart, dello Stanford Research Institute, offre una dimostrazione del NLS (oNLine System), le cui caratteristiche includono il browsing ipertestuale, l’editing e l’e-mail. Per consentire tutto ciò egli inventa il mouse.

1980

Tim Berners-Lee, consulente del CERN (Consiglio Europeo per le Ricerche Nucleari), scrive un software che consente ai documenti elettronici di collegarsi tra loro.

1990

Berners-Lee chiama il suo programma ipertestuale globale «World Wide Web».

Numero di siti Web esistenti: uno.

1993

Marc Andreessen distribuisce il browser Web Mosaic, che diventa il punto di forza di Netscape.

1994

Viene fondato il World Wide Web Consortium (W3C). Il numero di siti Web raggiunge i 10.000. Berners-Lee lancia l’idea della Rete Semantica.

1998

W3C diffonde la specifica eXtensible Markup Language (XML). Questo linguaggio permette di personalizzare le pagine Web di testo con etichette descrittive; un importante passo in avanti per la Rete Semantica.

2000

Alla fine dell’anno vengono identificati 25.675.581 siti Web.

2004

Sono completati gli standard che consentono ai computer di scambiare l’informazione sulla Rete Semantica. Berners-Lee viene nominato baronetto dalla regina Elisabetta II.

Mark Frauenfelder risiede a Los Angeles. Collabora regolarmente con l’edizione americana di «Technology Review».

Related Posts
Total
0
Share