personale, web May 1, 2008 9:59 pm (Save post)
Insomma, io arrivo qua al DERI che è il posto migliore del mondo per la ricerca sul semantic web, e non ne so una mazza.
Prima di partire a tutti quanti ho detto che sarei andato in irlanda a fare la tesi.
Che bello, dove?
Galway.
oh… su cosa?
Semantic Web.
oh..
Non è andata sempre così ma spesso.
Ora, che respiro trifogli & triple posso rispondere a entrambe le non domande mai poste.
La prima risposta è “sta a mezza altezza, a sinistra“.
La seconda è “il modo più semplice di cambiare il mondo“.
No, non ci credo neanche io a certe cazzate, ma comincio a essere agnostico.
La favola del web
C’era una volta un re, diranno subito i miei piccoli lettori.
Infatti, e il re voleva andare in vacanza a parigi a fine maggio o inizio giugno.
Ora, avendo notato che l’erba voglio non cresceva neanche nel proprio giardino, si rivolse a google, ma google si limita a fare ricerche testuali e quindi continuavano ad uscirgli fuori recensioni di alberghi a parigi, offerte di pacchetti turistici per proletari, e una cavolo di bionda idiota.
Markup Language
Ora, voi lo sapete che il web è fatto di codice che viene letto dalle macchine.
Basterebbe scrivere in modo che una macchina possa capirlo
questa pagina parla dell’albergo “Faustine”, situato vicino agli champs elisee, costo 2000 euri a notte in suite imperiale, libero a giugno
e un motore di ricerca lo troverebbe subito.
Eh, ma come si fa a dire tutta sta a roba a un camputer?
Tre parole per volta.
RDF
RDF è un modo per dire le cose in modo che i computer lo capiscano:
gabriele è umano
gabriele conosce michele
gabriele è-autore-di questo-blog
L’ultimo è bruttarello e disonesto, ma il concetto non cambia.
La triste realtà è che qualsiasi cosa si può descrivere con triple così. Se non ci credete, basta che fate la prova interrogatorio:
Qual’ è il soggetto?
Io
Qual’è il verbo?
Illuminarsi
Quando?
Al mattino
Di cosa?
D’immenso
Ad ogni modo, esistono un po’ di formati per trascrivere questa roba, uno in XML, altri più human readable. I computer capiscono comunque.
Ma gabriele chi è?
Gabriele è l’autore di questo blog, che a questo punto si fa anche girare le scatole che ancora non lo sapeste.
Per il semantic web’aro medio invece, è un URI.
In pratica, invece di dire “gabriele” dovreste dire che ne so, http://riffraff.info/gabriele#me.
Quando due documenti parlano di http://riffraff.info/gabriele#me il computer riuscirà sagacemente a capire che sono la stessa cosa.
Se io ho un file in cui dico che http://riffraff.info/gabriele#me è una persona, che si chiama “Gabriele Renzi” e paolo
ha un file in cui dice di conoscere http://riffraff.info/gabriele#me il computer potrà dire “paolo capriotti conosce gabriele renzi”.
Occhio, che un URI può essere praticamente tutto, basta che è unico.
Ad esempio, quello che c’è qua sopra non porta da nessuna parte, ma se l’URI è effettivamente un documento sul web, allora siete nel magico mondo dei Linked Data, che è più fico.
Povero re, e povero anche il cavallo
Tornando al nostro re, il computer si trova il file e vede un albergo libero vicino ai campi elisi
Il protagonista è nobile, ma anche ignorante, e non ha idea del fatto che gli champs elisee siano a parigi.
Il computer però può andare in un grande database di informazioni geografiche, dove trova la tripla champs elisee è-nella-città-di parigi .
A questo punto il computer ha trovato tutte le informazioni, il re se ne va in vacanza e scoppia la rivoluzione.
Potere al popolo
A questo punto avete capito il semantic web. Il resto è tutta roba in più.
Se state pensando ah beh ma che cosa complessa è impossibile non funzionerà è perché il complesso militare-tecno-industriale vi ha educati a pensare così.
Voi siete abituati a pensare che ogni volta che andate su un sito dovete mettere i dati. Che se volete parlare di libri anobii, scrive.it e le recensioni sul vostro blog sono scollegate. Che ogni volta che cercate qualcosa i risultati sono sempre un po’ a caso. Che gli amici su facebook sono uguali a quelli su linkedin e su myspace, ma che dovete ridirglieli tutte le volte. Che mica google è magico.
Ecco, fino ad oggi vi hanno detto cazzate. Sembro beppe grillo, lo so, ma è così.
Potere diffuso
La verità è che da anni i software che usiamo pubblicano dati in formati machine readable.
I calendari online, i link su wordpress, le vcard, il link che mettete quando volete dire che il vostro sito è sotto licenza creative commons.
Solo che non conviene a nessuno dirvelo.
Eh già perché tutti quelli che hanno i vostri dati si cagano addosso a pensare che voi questi dati potreste metterli da qualche parte dove tutti possono usarli, e non solo loro.
È per questo che OpenID è stupendo, perché finalmente la rete ha detto a google, microsoft e yahoo: Io so’ io, e voi non siete un cazzo.
Il Semantic Web è la stessa cosa, solo che invece di liberare qualche dato personale, li libera tutti.
Ora, potrei parlarvi di ontologie, reasoning e cosa faccio davvero, ma penso di aver già annoiato abbastanza.
Se voleste sapere qualche altra cosa, basta che fate un fischio.

