<?xml version="1.0" encoding="UTF-8"?>
<!-- generator="wordpress/1.5.1-alpha" -->
<rss version="2.0" 
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
>

<channel>
	<title>PDI^2</title>
	<link>http://riffraff.blogsome.com</link>
	<description>Propulsione d'Improbabilità Infinita</description>
	<pubDate>Mon, 18 Mar 2013 07:01:17 +0000</pubDate>
	<generator>http://wordpress.org/?v=1.5.1-alpha</generator>
	<language>en</language>

		<item>
		<title>Blogbabel, Autorità &#038; algoritmo del pagerank</title>
		<link>http://riffraff.blogsome.com/2007/05/31/blogbabel-autorita-algoritmo-del-pagerank/</link>
		<comments>http://riffraff.blogsome.com/2007/05/31/blogbabel-autorita-algoritmo-del-pagerank/#comments</comments>
		<pubDate>Thu, 31 May 2007 08:03:54 +0000</pubDate>
		<dc:creator>gabriele</dc:creator>
		
	<category>programmazione</category>
	<category>win</category>
	<category>blogosfera</category>
		<guid>http://riffraff.blogsome.com/2007/05/31/blogbabel-autorita-algoritmo-del-pagerank/</guid>
		<description><![CDATA[	Nel mio piano di conquistare il mondo manipolandone l&#8217;informazione sono diventato anche autore sul blog di blogbabel, e fra un po&#8217; dovreste se andate a vedere c&#8217;è un post sul fatto che quella che technorati ora definisce autorità è in realtà il mero conteggio dei link in ingresso.
Blogbabel non ha un&#8217;etichetta &#8220;autorità&#8221; ma ha dei [...]]]></description>
			<content:encoded><![CDATA[	<p>Nel mio piano di conquistare il mondo manipolandone l&#8217;informazione sono diventato anche autore sul <a href="http://it.blogbabel.com/blog">blog di blogbabel</a>, e fra un po&#8217; dovreste se andate a vedere c&#8217;è <a href="http://it.blogbabel.com/blog/2007/05/30/blogbabel-technorati-autorit-di-un-blog/">un post</a> sul fatto che quella che technorati ora definisce autorità è in realtà il mero conteggio dei link in ingresso.<br />
Blogbabel non ha un&#8217;etichetta &#8220;autorità&#8221; ma ha dei valori, in scala logaritmica, per classificare i blog. Ça va sans dire che Questo &Egrave; Comunque Meglio(TM).  </p>
	<p>Ma il geek che è in me stava pensando: e se effettuassimo un post-processing su questi dati? E se scopiazzassimo google?</p>
	<p><strong>Come funziona il pagerank</strong><br />
<em>(WARNING: l&#8217;autore ritiene che i nomi di funzione di una sola lettera siano il più grosso problema delle scienze moderne e li eviterà)</em></p>
	<p>L&#8217;algoritmo del PR pubbblicato originariamente dal dinamico duo page &#038; brin funziona, per quel ho capito io, in questo modo.<br />
Sia <strong>Imp(p)</strong> l&#8217;importanza di una pagina.<br />
Sia <strong>NumLink(p)</strong> il numero di link in una pagina.<br />
Una pagina <strong>P<sub>i</sub></strong> con un (1) link verso <strong>P<sub>j</sub></strong> conta come un voto di valore <strong>Imp(P<sub>i</sub>)</strong> per <strong>P<sub>j</sub></strong>. </p>
	<p>Ovvero, se alice.com vale 3 e ha un link per bruno.com questo si becca un 3.</p>
	<p>Se alice.com ha due link, di cui uno verso bruno.com e l&#8217;altro verso ciccio.com darà metà del suo valore ad entrambi, quindi:<br />
sia <strong>Vote(P<sub>i</sub>) = Imp(P<sub>i</sub>)/NumLink(P<sub>i</sub>)</strong>.</p>
	<p>A questo punto, l&#8217;importanza di <strong>P<sub>j</sub></strong> è la sommatoria di tutti i voti in ingresso:<br />
<strong>Imp(P<sub>j</sub>) = Sum(Vote(P<sub>i</sub>)) </strong><br />
per i diverso da j.</p>
	<p>L&#8217;astuto lettore noterà che l&#8217;importanza di un sito è definita in termini di se stessa. Ovvero, pensate ad un grafo composto da alice.com bruno.com e ciccio.info e fatto così:<br />
alice ->bruno<br />
alice ->ciccio<br />
bruno -> ciccio<br />
ciccio -> alice</p>
	<p>Per calcolare l&#8217;importanza di ciccio dobbiamo sapere l&#8217;importanza di bruno ed alice. Per sapere l&#8217;importanza di bruno dobbiamo sapere quella di alice. Per sapere quella di alice dobbiamo sapere quella di ciccio. Stack overflow. </p>
	<p><strong>E risolviamola sta cosa..</strong><br />
A questo punto la magica coppia tira fuori la matrice <strong>HyperLinks</strong>, che in pratica è una tabella <strong>NumPagesInTheWeb * NumPagesInTheWeb</strong> in cui le caselle sono tutte <strong>0</strong> a meno che non ci sia un link da una pagina I a una pagina J, nel qual caso <strong>HyperLinks[I,J]= 1/NumLink(P<sub>j</sub>)</strong>.</p>
	<p>In pratica è il discorso di prima, solo in forma tabellare. </p>
	<p>Potete verificare a occhio che se sommate tutti gli elementi di una colonna viene <strong>1</strong>, e se sommate quelli in una riga&#8230; viene qualcos&#8217;altro. </p>
	<p>Ora, inventiamo anche il vettore <strong>ImpVector</strong>, tale che<br />
<strong>ImpVector = HyperLinks * ImpVector</strong>. Questa non è altro che una ri-definizione della cosa che avevamo scritto prima.<br />
<strong>ImpVector </strong>è cioè un vettore che contiene i vari valori di importanza di una pagina.</p>
	<p><strong>Guarda che è ancora ricorsiva..</strong></p>
	<p>Il trucco per risolvere questo affare è di scegliere un vettore sperando di azzeccarci.<br />
Se <strong>ImpVector = HyperLinks * ImpVector</strong> abbiamo finito,  e faremmo bene a correre nel più vicino ippodromo perché avremmo un futuro nel campo delle scommesse.<br />
Altrimenti usiamo il risultato, <strong>ImpVector<sup>1</sup></strong> come nuovo vettore casuale e verifichiamo se <strong>ImpVector<sup>1</sup> = HyperLinks * ImpVector<sup>1</sup></strong>. E così via finché non arriviamo ad un valore azzeccato (o quantomeno abbastanza vicino).</p>
	<p><strong>Ma non è che debba convergere per forza, specialmente a valori sensati..</strong></p>
	<p>Infatti. A questo punto Sergey e Larry buttano dentro i loro deliranti approcci probabilistici, in cui il Lettore dovrà impersonificarsi in un normale utente di internet che segue link, e non uno che apre solo il suo aggregatore. </p>
	<p>L&#8217;idea è che la formuletta di cui sopra sia isomorfa ad una che descriva un navigatore di internet che va su una pagina e ci sta per un certo tempo e poi naviga via. Semplicemente sostituite <strong>Time</strong> a <strong>Imp</strong> nella formula di cui sopra. </p>
	<p>In pratica in quest&#8217;ottica i problemi si manifestano quando un utente finisce su un sito che non ha link verso l&#8217;esterno (il blog di beppe grillo) o quando finisce in un pozzo in cui vari siti si linkano tra loro ma non linkano il resto di internet.</p>
	<p>Se vi capita la prima cosa, essendo geek non uscirete a giocare a pallone, ma andrete su un&#8217;altra pagina digitando l&#8217;url direttamente.<br />
Nel secondo caso, essendo geek, non resterete in loop su 3 pagine, ma digiterete l&#8217;url di un altro sito direttamente.<br />
La prima cosa si modella mettendo un valore <strong>1/NumPagesInTheWeb</strong> in tutti gli elementi delle colonne in cui una pagina non ha link  (ovvero, da una pagina senza link andrete a caso su un&#8217;altra). La matrice viene simpaticamente chiamata <strong>S</strong> perché è una matrice stocastica, ovvero ha delle proprietà che ignoreremo perché sono noiose. La chiameremo invece <strong>HyperLinksWithEscapes</strong></p>
	<p>La seconda si ottiene pensando che l&#8217;utente non segua sempre un link, Ma che abbia due possibilità: o segue un link concentrandosi sul suo obiettivo o va su un&#8217;altra pagina a caso, con probabilità <strong>Concentration</strong> e <strong>Distraction = 1 - Concentration</strong>. </p>
	<p>Il passo finale è definire<br />
<strong>GoogleMatrix = Concentration * HyperlinksWithEscapes + Distraction * JustEscapes</strong></p>
	<p>dove <strong>JustEscapes</strong> è una matrice delle stesse dimensioni in cui tutti i valori sono <strong>1/NumPagesInTheWeb</strong>, sarebbe a dire che l&#8217;utente può andare da una pagina in qualsiasi altra con la stessa probabilità.</p>
	<p>A questo punto, <strong>ImpVector = GoogleMatrix * ImpVector</strong> è risolvibile sempre per ragioni matematiche prolisse.<br />
E scelto un valore adeguato di <strong>Concentration</strong> converge abbastanza velocemente.<br />
La scelta è che mi addentri in dettagli noiosi (per me) o mi limiti a dirvi che <strong>Concentration = 0.85</strong>. Seclgo la seconda, pur restando convinto che 0.84 sarebbe stato un valore più interessante in quanto multiplo di 0.42. </p>
	<p><strong>Scusa, e che c&#8217;entra questo con BlogBabel?</strong><br />
Beh, sarebbe fico se calcolassimo l&#8217;autorità di un blog utilizzando questo metodo, in fondo abbiamo la matrice dei link. Peccato che la matrice sia comunque 7000 x 7000 e che ci vogliano un&#8217;ottantina di iterazioni per convergere.<br />
Plausibilmente sarebbe ancora fattibile (se vi va di leggere <a href="http://infolab.stanford.edu/pub/papers/google.pdf">il paper sul pagerank</a> ci sono spiegazioni su come la cosa sia ottimizzabile), ma si porrebbe un problema: che fine fanno tutti gli altri valori di BB? </p>
	<p>I link tra i blog di BB non esprimono interamente il valore  di un blog.</p>
	<p>Il numero dei lettori, la sua collocazione nella blogosfera mondiale, nell&#8217;internet a tutto tondo e nei blog italiani non ancora aggiunti resterebbero fuori da questo calcolo. </p>
	<p>Si potrebbe dunque usare questo approccio semplicemente per il calcolo delo valore del tracklink, ovvero dei link raccolti dal crawler di blogbabel. Ma vale la pena perdere tempo computazionale e di sviluppo per ottenere  un valore che</p>
	<ul>
	<li>probabilmente sarebbe simile al punteggio tracklink attuale</li>
	<li>avrebbe un incidenza piuttosto ridotta sul punteggio totale</li>
	<li>sarebbe fondamentalmente inutile, in quanto la classifica è in se fondamentalmente un divertissement?</li>
	</ul>
	<p>Penso di no. Però mi chiedo se non si possa tirare fuori un algoritmo che esprima la rilevanza di un blog pesandola attraverso la matrice dei tracklink ed usando i valori totali attuali come input. Suggerimenti benvenuti.
</p>
]]></content:encoded>
			<wfw:commentRss>http://riffraff.blogsome.com/2007/05/31/blogbabel-autorita-algoritmo-del-pagerank/feed/</wfw:commentRss>
	</item>
		<item>
		<title>pagina d&#8217;errore capolavoro</title>
		<link>http://riffraff.blogsome.com/2006/11/17/pagina-derrore-capolavoro/</link>
		<comments>http://riffraff.blogsome.com/2006/11/17/pagina-derrore-capolavoro/#comments</comments>
		<pubDate>Fri, 17 Nov 2006 13:51:53 +0000</pubDate>
		<dc:creator>gabriele</dc:creator>
		
	<category>win</category>
	<category>fun</category>
		<guid>http://riffraff.blogsome.com/2006/11/17/pagina-derrore-capolavoro/</guid>
		<description><![CDATA[	Questo è un capolavoro, Via raptxt,

]]></description>
			<content:encoded><![CDATA[	<p><a href="http://www.apogeonline.com/libri/88-503-2059-0/scheda">Questo è un capolavoro</a>, Via <a href="http://raptxt.it/blg/2006/11/17/il-nostro-webmaster-e-un-inetto/">raptxt</a>,
</p>
]]></content:encoded>
			<wfw:commentRss>http://riffraff.blogsome.com/2006/11/17/pagina-derrore-capolavoro/feed/</wfw:commentRss>
	</item>
		<item>
		<title>Microsoft si pappa Opera</title>
		<link>http://riffraff.blogsome.com/2005/12/23/microsoft-si-pappa-opera/</link>
		<comments>http://riffraff.blogsome.com/2005/12/23/microsoft-si-pappa-opera/#comments</comments>
		<pubDate>Fri, 23 Dec 2005 10:40:26 +0000</pubDate>
		<dc:creator>gabriele</dc:creator>
		
	<category>win</category>
	<category>web</category>
	<category>software</category>
		<guid>http://riffraff.blogsome.com/2005/12/23/microsoft-si-pappa-opera/</guid>
		<description><![CDATA[	Semplicemnte allibito. Ma che bel giorno per gli standard nel web.
	CoolTechZone::Microsoft Buys Out Opera
]]></description>
			<content:encoded><![CDATA[	<p>Semplicemnte allibito. Ma che bel giorno per gli standard nel web.</p>
	<p><a href="http://www.cooltechzone.com/index.php?option=content&#038;task=view&#038;id=2108">CoolTechZone::Microsoft Buys Out Opera</a></p>
]]></content:encoded>
			<wfw:commentRss>http://riffraff.blogsome.com/2005/12/23/microsoft-si-pappa-opera/feed/</wfw:commentRss>
	</item>
		<item>
		<title>Basta con windows sui portatili?</title>
		<link>http://riffraff.blogsome.com/2005/11/29/basta-con-windows-wui-portatili/</link>
		<comments>http://riffraff.blogsome.com/2005/11/29/basta-con-windows-wui-portatili/#comments</comments>
		<pubDate>Tue, 29 Nov 2005 10:21:51 +0000</pubDate>
		<dc:creator>gabriele</dc:creator>
		
	<category>Uncategorized</category>
	<category>win</category>
	<category>linux</category>
	<category>italia</category>
		<guid>http://riffraff.blogsome.com/2005/11/29/basta-con-windows-wui-portatili/</guid>
		<description><![CDATA[	Sembra che finalmente un&#8217;associazione dei consumatori abbia denunciato La Megaditta (in questo caso HP) per aver costretto un loro  protetto a comprare un inutile licenza di Windows XP Home.
L&#8217;ADUC ha impugnato la EULA(occhio, pdf).
	La cosa interessante no è la cosa in se, Paolo Attivissimo lo fece già molto tempo fa, ma il fatto che [...]]]></description>
			<content:encoded><![CDATA[	<p>Sembra che finalmente un&#8217;associazione dei consumatori abbia denunciato La Megaditta (in questo caso HP) per aver costretto un loro  protetto a comprare un inutile licenza di Windows XP Home.<br />
L&#8217;ADUC ha <a href="http://www.aduc.it/dyn/documenti/allegati/CitazioneHP.pdf">impugnato la EULA</a>(occhio, pdf).</p>
	<p>La cosa interessante no è la cosa in se, Paolo Attivissimo lo fece già molto tempo fa, ma il fatto che sia entrata in gioco un&#8217;associazione di dimensioni considereveli, il che potrebbe innescare una reazione a catena.<br />
Che sia la volta buona che si smuove qualcosa e cominciano a vendere notebook senza SO ?
</p>
]]></content:encoded>
			<wfw:commentRss>http://riffraff.blogsome.com/2005/11/29/basta-con-windows-wui-portatili/feed/</wfw:commentRss>
	</item>
		<item>
		<title>Live Safety</title>
		<link>http://riffraff.blogsome.com/2005/11/06/live-safety-2/</link>
		<comments>http://riffraff.blogsome.com/2005/11/06/live-safety-2/#comments</comments>
		<pubDate>Sun, 06 Nov 2005 11:16:11 +0000</pubDate>
		<dc:creator>gabriele</dc:creator>
		
	<category>win</category>
	<category>web</category>
	<category>software</category>
		<guid>http://riffraff.blogsome.com/2005/11/06/live-safety-2/</guid>
		<description><![CDATA[	Il nuovo servizio live di microsoft (che poi mi chiedo quanto spenda microsoft per acquistare domini come live.com, passport.net e via dicendo) offre anche alcuni simpatici servizi online. 
	Non funzionano con firefox in quanto sono basati su activex, ma se avete ancora un&#8217;installazione windows avrete comunque IE da qualche parte anche se magari avreste preferito [...]]]></description>
			<content:encoded><![CDATA[	<p>Il nuovo servizio <a href="http://www.live.com">live </a>di microsoft (che poi mi chiedo quanto spenda microsoft per acquistare domini come live.com, passport.net e via dicendo) offre anche alcuni simpatici servizi online. </p>
	<p>Non funzionano con firefox in quanto sono basati su activex, ma se avete ancora un&#8217;installazione windows avrete comunque IE da qualche parte anche se magari avreste preferito di no. </p>
	<p>Tra i servizi di <a href="http://safety.live.com">safety.live.com</a> ci sono anche defrag, pulizia del disco e controllo antivirus.<br />
Non dico che le prime due serva a qualcosa farle da lì, ma avere un antivirus free (as in beer), discretamente veloce (la prima volta si devono scaricare gli activex ed è un po&#8217; più lento ma le volte seguenti è abbastanza efficiente) e che soprattutto non ammazza la macchina, è sicuramente una ottima cosa per l&#8217;utenza windows. </p>
	<p>Per quel che mi riguarda ho provato le due scansioni (quick e full), ed il risultato è che non sembra io sia infestato dai virus, sebbene rifugga dagli AV da 6 anni. Sarà perché non uso outlook immagino <img src='http://riffraff.blogsome.com/wp-images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' />
</p>
]]></content:encoded>
			<wfw:commentRss>http://riffraff.blogsome.com/2005/11/06/live-safety-2/feed/</wfw:commentRss>
	</item>
		<item>
		<title>Xchat su win32.. a pagamento?</title>
		<link>http://riffraff.blogsome.com/2005/10/11/xchat-su-win32-a-pagamento/</link>
		<comments>http://riffraff.blogsome.com/2005/10/11/xchat-su-win32-a-pagamento/#comments</comments>
		<pubDate>Tue, 11 Oct 2005 09:08:06 +0000</pubDate>
		<dc:creator>gabriele</dc:creator>
		
	<category>Uncategorized</category>
	<category>win</category>
	<category>linux</category>
	<category>xchat</category>
	<category>free</category>
		<guid>http://riffraff.blogsome.com/2005/10/11/xchat-su-win32-a-pagamento/</guid>
		<description><![CDATA[	Da buon utente ibrido win/linux  cerco sistematicamente di far convergere i due ambienti.
Firefox, thunderbird, le utilità di shell, wget, python, ruby, perl, (g)vim, Gtk2, sono tutte cose che si possono usare su entrambi i sistemi.
Quindi per usare irc, alla fine mi son ritrovato con xchat (anche perché in certi posti ci si arrabbiava che [...]]]></description>
			<content:encoded><![CDATA[	<p>Da buon utente ibrido win/linux  cerco sistematicamente di far convergere i due ambienti.<br />
Firefox, thunderbird, le utilità di shell, wget, python, ruby, perl, (g)vim, Gtk2, sono tutte cose che si possono usare su entrambi i sistemi.<br />
Quindi per usare irc, alla fine mi son ritrovato con xchat (anche perché <a href="http://netartmagazine.com/2003/IrcVerbamanent">in certi posti</a> ci si arrabbiava che mIRC non supporti utf8 <img src='http://riffraff.blogsome.com/wp-images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' /> .</p>
	<p>Dunque scarico xchat e lo uso felicemente fino a l&#8217;altro ieri, quando il simpatico eseguibile ha voluto spiegarmi che xchat su win32 è <em>una versione trial</em>. Voglio dire,  <a href="http://xchat.org/windows/#register">potete acquistare una licenza</a>, altrimenti il programma smette di funzionare.</p>
	<p>La spiegazione che danno quelli di xchat è che <em> &#8220;compilare xchat per win32 è una faticaccia, se non volete pagare compilatevelo voi&#8221;</em>.<br />
Non dico che uno non debba desiderare di essere pagato, ma che motivazione schifosa. </p>
	<p>Ad ogni buon conto, ovviamente dozzine di persone hanno compilato xchat per win32 e lo hanno messo online. Free as in beer.<br />
Per i posteri, <a href="http://silenceisdefeat.org/~b0at/xchat/win32/">qua </a>si trova una lista
</p>
]]></content:encoded>
			<wfw:commentRss>http://riffraff.blogsome.com/2005/10/11/xchat-su-win32-a-pagamento/feed/</wfw:commentRss>
	</item>
	</channel>
</rss>
