PDI^2

Dove cavolo sta galway o che cos’è il semantic web (for dummies)

personale, web May 1, 2008 9:59 pm (Save post)

Insomma, io arrivo qua al DERI che è il posto migliore del mondo per la ricerca sul semantic web, e non ne so una mazza.

Prima di partire a tutti quanti ho detto che sarei andato in irlanda a fare la tesi.
Che bello, dove?
Galway.
oh… su cosa?
Semantic Web.
oh..

Non è andata sempre così ma spesso.

Ora, che respiro trifogli & triple posso rispondere a entrambe le non domande mai poste.
La prima risposta è “sta a mezza altezza, a sinistra“.
La seconda è “il modo più semplice di cambiare il mondo“.

No, non ci credo neanche io a certe cazzate, ma comincio a essere agnostico.

La favola del web
C’era una volta un re, diranno subito i miei piccoli lettori.

Infatti, e il re voleva andare in vacanza a parigi a fine maggio o inizio giugno.
Ora, avendo notato che l’erba voglio non cresceva neanche nel proprio giardino, si rivolse a google, ma google si limita a fare ricerche testuali e quindi continuavano ad uscirgli fuori recensioni di alberghi a parigi, offerte di pacchetti turistici per proletari, e una cavolo di bionda idiota.

Markup Language
Ora, voi lo sapete che il web è fatto di codice che viene letto dalle macchine.
Basterebbe scrivere in modo che una macchina possa capirlo

questa pagina parla dell’albergo “Faustine”, situato vicino agli champs elisee, costo 2000 euri a notte in suite imperiale, libero a giugno

e un motore di ricerca lo troverebbe subito.

Eh, ma come si fa a dire tutta sta a roba a un camputer?
Tre parole per volta.

RDF
RDF è un modo per dire le cose in modo che i computer lo capiscano:
gabriele è umano
gabriele conosce michele
gabriele è-autore-di questo-blog

L’ultimo è bruttarello e disonesto, ma il concetto non cambia.
La triste realtà è che qualsiasi cosa si può descrivere con triple così. Se non ci credete, basta che fate la prova interrogatorio:

Qual’ è il soggetto?
Io
Qual’è il verbo?
Illuminarsi
Quando?
Al mattino
Di cosa?
D’immenso

Ad ogni modo, esistono un po’ di formati per trascrivere questa roba, uno in XML, altri più human readable. I computer capiscono comunque.

Ma gabriele chi è?
Gabriele è l’autore di questo blog, che a questo punto si fa anche girare le scatole che ancora non lo sapeste.
Per il semantic web’aro medio invece, è un URI.

In pratica, invece di dire “gabriele” dovreste dire che ne so, http://riffraff.info/gabriele#me.
Quando due documenti parlano di http://riffraff.info/gabriele#me il computer riuscirà sagacemente a capire che sono la stessa cosa.

Se io ho un file in cui dico che http://riffraff.info/gabriele#me è una persona, che si chiama “Gabriele Renzi” e paolo
ha un file in cui dice di conoscere http://riffraff.info/gabriele#me il computer potrà dire “paolo capriotti conosce gabriele renzi”.

Occhio, che un URI può essere praticamente tutto, basta che è unico.

Ad esempio, quello che c’è qua sopra non porta da nessuna parte, ma se l’URI è effettivamente un documento sul web, allora siete nel magico mondo dei Linked Data, che è più fico.

Povero re, e povero anche il cavallo
Tornando al nostro re, il computer si trova il file e vede un albergo libero vicino ai campi elisi
Il protagonista è nobile, ma anche ignorante, e non ha idea del fatto che gli champs elisee siano a parigi.

Il computer però può andare in un grande database di informazioni geografiche, dove trova la tripla champs elisee è-nella-città-di parigi .

A questo punto il computer ha trovato tutte le informazioni, il re se ne va in vacanza e scoppia la rivoluzione.

Potere al popolo
A questo punto avete capito il semantic web. Il resto è tutta roba in più.
Se state pensando ah beh ma che cosa complessa è impossibile non funzionerà è perché il complesso militare-tecno-industriale vi ha educati a pensare così.

Voi siete abituati a pensare che ogni volta che andate su un sito dovete mettere i dati. Che se volete parlare di libri anobii, scrive.it e le recensioni sul vostro blog sono scollegate. Che ogni volta che cercate qualcosa i risultati sono sempre un po’ a caso. Che gli amici su facebook sono uguali a quelli su linkedin e su myspace, ma che dovete ridirglieli tutte le volte. Che mica google è magico.

Ecco, fino ad oggi vi hanno detto cazzate. Sembro beppe grillo, lo so, ma è così.

Potere diffuso
La verità è che da anni i software che usiamo pubblicano dati in formati machine readable.
I calendari online, i link su wordpress, le vcard, il link che mettete quando volete dire che il vostro sito è sotto licenza creative commons.

Solo che non conviene a nessuno dirvelo.
Eh già perché tutti quelli che hanno i vostri dati si cagano addosso a pensare che voi questi dati potreste metterli da qualche parte dove tutti possono usarli, e non solo loro.
È per questo che OpenID è stupendo, perché finalmente la rete ha detto a google, microsoft e yahoo: Io so’ io, e voi non siete un cazzo.

Il Semantic Web è la stessa cosa, solo che invece di liberare qualche dato personale, li libera tutti.

Ora, potrei parlarvi di ontologie, reasoning e cosa faccio davvero, ma penso di aver già annoiato abbastanza.
Se voleste sapere qualche altra cosa, basta che fate un fischio.

portishead @ lastfm

web April 22, 2008 8:20 pm (Save post)

shhhhh, Third dei portishead è in streaming su last.fm. Amo internet, alle volte.

Ah, si qua comunque tutto bene, ne scriverò, prima o poi.

articoletto su darcs

programmazione, web February 4, 2008 8:02 am (Save post)

Su StackTrace l’editor della categoria SW Engineering (piergiuliano bossi) ha pubblicato un mio articoletto su darcs, andate a darci un’occhiata :)

Se l’editor di The Ruby Mine (andrea reginato) trova tempo di riscriver^Wcorreggerlo, dovrebbe apparire un mio articoletto anche lì.

E con questo posso tirare una riga su “Cose da fare nel 2008: scrivere qualcosa per TRM e ST“.

Osservazioni Ombelicali

personale, web January 30, 2008 9:56 pm (Save post)

Non posso lavorare perché sono le 22 e farei danni.
Studiare perché non capirei niente.
Vedere la tv perché non c’è una mazza.
Trafficare con $PROGETTO_PER_ARRICCHIRMI perché ho un test che fallisce che richiede troppo sforzo.
Leggere, non so perché.

Quindi sto perdendo tempo a vedere come la gente arriva su questo sito. Ah, nessuno che sia qui per un motivo sensato.

Sono il terzo risultato su google per imparare il giapponese, ok sono utile, e poi almeno un lettore che parla giapponese c’è.
Ma sono anche il secondo per “how to add atoms”, e fidatevi non ne so niente.

Sono in prima pagina per “funny dirty definitions and tests to print”, che non so neanche cosa significhi, ma solo se cerchi su google neozelandese(?), mentre pare sia il più autorevole blogger ad aver parlato di bratislava, e non immaginate quante visite causa, non solo da google, ma da motori di ricerca ignoti tipo trovafacile (?). Non ne so un cazzo di bratislava, ci sono stato 2 giorni un anno e mezzo fa, e ne parlo pure male, poverina.

C’è gente che arriva qui cercando il mio nome e cognome da almeno sei nazioni diverse, tra cui un dominio .lu, che non so cosa sia. O posseggo omonimi ovunque, o devo aver fatto qualcosa di terribile che è finito su youtube.

Google.md (?) mi considera esperto riguardo a “incubatore”, e Google.com.tr (??) pensa che io ne sappia di “alphabet sirb”.

Sono quasi più autorevole di html.it riguardo php6 e pare sia il riferimento nazionale per mettere variabili dentro regexp in perl. Mi pare si faccia /$variabile/.

Mi chiedo cosa vogliano dirmi i motori di ricerca. Che dovrei cominciare a mangiare paté di coratella, visto che diverse persone arrivano qui cercando quello? Che devo tornare in repubblica slovacca? Che devo definitivamente imparare la lingua nipponica?

O forse mi stanno solo rivelando la mia vera natura.
Sono membro di un movimento di search engine psychological warfare.

Contribuisco a rendere il mondo un posto più strano, come la cattiva recensione su ebay con commento “il pacco conteneva una lince infuriata“.

FabChannel ROX!

web September 22, 2007 9:32 am (Save post)

Ok, scusate il titolo l4me ma è da venti minuti che guardo un concerto dei CSS e mi prende così.

Dicevo, guardo un concerto, perché fabchannel è uno di questi servizi youtube-ish in cui si possono vedere video, solo che è specializzato in video di live.

La possibilità di trovare video di gruppuscoli di non ovvio reperimento me lo fa apprezzare un casino. Perché non me l’avete detto prima che esisteva?

coComments diventa uno schifo, passo a co.mments e mi scrive l’estensione

programmazione, web, software August 31, 2007 10:32 am (Save post)

La versione 2.0 beta di coComments è stata accolta da una salva di critiche enorme, al punto che gli autori hanno tenuto a specificare che no, suvvia, non è che deve rimanere così, gli utenti sono quelli che comandano etc etc…

A me però anche dopo le ri-modifiche continua a non piacere. Già prima era abbastanza bruttino, e l’estensione per firefox, per quanto potente, era ultralenta.

Per cui sto sperimentando con co.mments.com, che ha un tracking dei commenti molto migliore.

Purtroppo non ha integrazione col browser, il che significa dover cliccare su una bookmarklet per registrare una conversazione e visitare il sito per vedere le novità (o leggere il feed).

Per la prima cosa, non è un vero problema, e anzi, ha dei vantaggi.

La seconda è un po’ scomoda, per cui ho smanettato un po’ e mi son tirato fuori un’estensione per firefox che mostra un’iconcina colorata nella status bar quando ci sono nuovi commenti, e cliccando sulla quale si può andare a vedere il tracking.
Ho smanettato due ore, poi le divinità di javascript mi hanno dato una mano e ho ottenuto una cosa funzionante in 4 minuti netti.

Se volete provarla fate un fischio.

Post Archivio n° 18

personale, blogosfera, web June 29, 2007 11:57 am (Save post)

pan e salam pan e salam — a fette!.
Lettore, ho due esami la prossima settimana di cui no so ancora nulla. Ho amiche in visita con cui mi piacerebbe passare del tempo. Fa un caldo della madonna. Ho fame, mi fa male il collo, il mio mac è rotto di nuovo, il cellulare è partito e per una volta che ho roba da leggere non ho il tempo. Ergo, Archivio.

  1. L’angolo del linguista: l’ungherese è una lingua agglutinativa, come il giapponese. Leggasi: le parole non hanno una radice fissa e una parte mutabile, come in italiano (amico, amica, amici) ma hanno una base che è la parola in se e delle particelle fisse che ci si attaccano (borat, boratno, boratok). Il bello èp che hanno una particella per tutto, dal plurale allo stato in luogo ai complementi temporali. La scoperta della settimana è il suffisso -getni/gatni che significa una cosa come “più volte ma in modo piccolo”.
    Apprezzate il fatto che non solo si possa dire “mangiucchiare“, ma che “coccolare” sia, letteralmente, “abbracciucchiare:) .
  2. sull’isola deserta porterei da leggere, l’enciclopedia, credo. Una maschera, per fare immersioni. Un rotolo di spago enorme, che serve a tutto. Una radio, che non si sa mai, e poi si possono fare le batterie con le noci di cocco. E un asciugamano, perché ho letto douglas adams ;)
  3. Alberto++ per Evenz, anche se io l’avrei chiamato E20 :)
  4. Sto abusando SimpleFold e sono strasoddisfatto, se usate vim fateci un pensierino. Prossimo passo è cominciare a sfruttare rcodetools
  5. Il mio stupido doctest per ruby adesso riporta la linea corretta in cui è accaduto l’errore, yay!
  6. Finalmente ho trovato un server NNTP aperto e che contiene sia comp.lang.ruby che it.comp.lang.python. Posso tornare a lurkare e fare il troll, evviva!
  7. giovanni ha un blog da un quarto d’ora ed ha già articoli più interessanti dei miei, come quelli sui RESTful Web Service in Squeak

Vabè, torno a studiare quella materia interessante ma con esame infernale che è Informatica Teorica II. Buon weekend a chi non deve fare una mazza!

UidBind e il self-marketing

programmazione, linux, web June 24, 2007 2:37 pm (Save post)

Da anni sono un utente felice di un certo servizio di hosting, per vari motivi.

Primo, sono open-source friendly. Nel senso che usano software libero, contribuiscono allo sviluppo di quel che usano e supportano la gente che supporta l’open source, come ruby-it o ziobudda .

Secondo, ho il supporto via jabber di una persona (roberto) che conosco di persona :)

Terzo, sono una manica di hacker, nel senso positivo del termine. Il vero motivo per cui su unbit è possibile usare Camping o Django, si ha disposizione mercurial, e si può accedere al pannello di controllo tramite XMP-RPC è perché è fico, non perché ci sia un grosso mercato.

Ma essendo una manica di hacker hanno anche i tipici difetti di relazione col mondo, ad esempio una homepage inaccessibile.

Tutto questo per parlarvi di uidbind, che è un modulo kernel per linux che permette di impostare permessi di accesso granulari a specifiche porte TCP/UDP.

L’amministratore può, tramite un albero di directory configfs, selezionare alcune porte e rendere possibile solo all’utente X di effettuare una bind() su di esse, il che ha un grosso potenziale per evitare che si crei casino.

Mettiamo che si permetta agli utenti di lanciare dei server (esempio: mongrel, o tomcat). Il default è che gli utenti comincino a pestarsi i piedi a vicenda, andando ogni volta a occupare le porte altrui e forzando un algoritmo distribuito di “ti frego la porta o devo modificare le configurazioni” che è decisamente sgradevole.

Con uidbind è possibile assegnare ad ogni utente una porta e far si che usi sempre e solo quella e che nessun altro abbia la possibilità di usarla, in nessun modo.

Il modulo ha anche il potenziale di eliminare quella vecchissima eredità di UNIX per cui le prime 1024 porte sono riservate a root. La ragione, all’epoca, era che si voleva evitare che un utente potesse effettuare l’hijack di servizi trusted (esempio: telnet o http), ma l’effetto collaterale è che ancora oggi tutti i servizi classici devono partire inizialmente come root.
Facendo si che l’accesso alle porte sia gestito in modo granulare sarebbe possibile riservare le prime porte a root e poi, caso per caso, riassegnarle ad utenti specifici come httpd o smtpd, superando finalmente limitazioni vecchie di decenni.

Ora vabè che il modulo è ancora in betamm ma guardate la pagina di uidbind. Neanche un po’ di auto-esaltazione porca miseria!

Le API di BlogBabel e il mio feedflare

blogosfera, web June 23, 2007 10:10 am (Save post)

Finalmente BlogBabel ha un set di API REST & pubbliche per accedere alle informazioni della classifica e del crawler.

Andtate a giocarci pure voi e vedete che ne pensate, così potete darci feedback e ci mettiamo una pezza dove sono più smandrappate. Io credo ci siano già le potenzialità per farci un sacco di cose carine, tra cui la mia prima è (rullo di tamburi) il feedflare!

Ovvero quella cosa che vedete in fondo ai miei post nel feed e nel sito, che dice che posto ho in classifica. Prima era una cosa privata perché abusava dello screen scraping su BlogBabel e non volevo fare casini.

Adesso potete sperimentarlo pure voi, non vi garantisco che funzionerà per sempre o che non muoia sotto il carico, ma insomma, potete provarci. Vediamo quanto scala questa applicazione rails, a occhio fino a 11.000 richieste al secondo dovrei arrivarci :)

Per utilizzare il feedflare di blogbabel basta che andiate nel tab “optimize” di feedburner e aggiungiate un feedflare con URL:


  http://flarez.riffraff.info/bb?lang=it&id=blogid&version=1

ovviamente lang è sempre “it” e blogid è l’identificativo del blog su BlogBabel (questo blog ha id “pdi2″ non “PDI^2″, “Gabriele Blog” o “Propulsione d’Improbabilità Infinita”). In pratica è lo slug che vedete nell’url dei dettagli del vostro blog.

Andate e verificate, e fatemi sapere se ci sono problemi.

le mie due lire: google mangia feedburner & panoramio

web, fastidio June 5, 2007 8:45 am (Save post)

Potremmo fare i discorsi del tipo “papà, tu dov’eri quando google ha spento internet?” ma di mattina la paranoia è a livelli bassi. Linko berny, che è l’unico che abbia letto nella lingua di Dante a fare un commento un po’ critico.

Ma mi dispiace che google si sia pappato feedburner, per vari motivi.
Primo, il servizio di feedburner era innovativo, interessante e porca miseria il supporto mi ha sempre risposto nell’arco di 6 ore. Le garanzie che rimanga così non ci sono. Ammetto che mi è sempre sembrato implementabile in due settimane, mod layout.

Secondo, effettivamente è un po’ inquietante che una percentuale massiccia dei link cliccati nel mondo potrebbero essere serviti, e tracciati, da google,

Terzo, feedburner ha un’ottima tradizione di api aperte, Google la sta perdendo.

Ma soprattutto è triste se guardiamo in retrospettiva alle ultime acquisizioni di google, tra cui: panoramio, feedburner, youtube, doubleclick, writely.
Escludiamo doubleclick, che chiaramente è web 0.2 e quindi non è nella stessa categoria degli altri.
L’unica strategia commerciale di panoramio, youtube e writely è stata diventare famosi e vendere. In alcuni casi, come per writely, il business plan era “vendiamo a google“, dichiaratamente.

Feedburner d’altro canto aveva una possibilità di farcela da solo. Aveva gli inserzionisti, il feed advertising ha grosse potenzialità, era leader nel mercato e senza concorrenti importanti. Aveva anche fatto acquisizioni importanti, e avevano una visione.

Perché cavolo han venduto a google? Gli avranno dato una marea di soldi, in pieno stile bolla2.0?
Probabile. Ma la mia paura è che abbiano venduto perché era un offerta che non potevano rifiutare, in pieno stile padrino2.0.

Prendi questi numerosi sacchi di soldi, e sbrigati. Se non lo fai saremo costretti a entrare nel tuo mercato. Non sarà molto faticoso, perché

  • abbiamo già l’infrastruttura per scalare all’infinito
  • abbiamo già il polling dei feed
  • abbiamo già gli inserzionisti
  • abbiamo già il sistema di statistiche
  • abbiamo parecchi milioni di utenti già nella nostra rete, tu neanche cinquecentomila

ci faresti perdere tempo e sprecare soldi, ma ti spazzeremmo via e spenderemmo meno che per acquistarti.

Certo, puoi fare come ICQ, non vendere e proseguire da solo.
Si ti ricordi, quell’instant messenger che andava tanti anni fa, prima che microsoft decidesse di annichilirlo.

Sono LarrySergey dei googleborg. La resistenza è futile, preparatevi ad essere assimilati.

Get free blog up and running in minutes with Blogsome
Theme designed by Janis Joseph