lunedì 8 gennaio 2007

Assegnazione del Page Rank



Da quanto ho potuto apprendere fino ad ora, il PageRank segue un modello che premia la “fitness” di un nodo (per citare il termine utilizzato da
Barabási). Ma la formula che calcola il PageRank segue un modello che non registra esattamente i meccanismi complessi di una rete come il World Wide Web. Piuttosto cerca di avvicinarsi quanto più possibile alla realtà. E anche se si avvicina molto bene a questo scopo, ha dei limiti dettati proprio dal modello utilizzato.

Da quanto letto NON credo che PageRank sia il modello migliore per descrivere la rete.
Un esempio è questo: i blog come quelli pubblicati su Blogger (di proprietà di Google) ricevono alti punteggi di PageRank (PR=4) dopo appena poche settimane dalla loro pubblicazione.
Questo si può spiegare solo con la volontà di fare apparire come ben posizionate le pagine dei blogger.


Credo che la risposta sia tutta nel modo in cui Google ha avuto successo nonostante si sia inserito relativamente tardi nel panorama interrnet, quando Yahoo e Altavista erano già dei colossi.

Google ha adottato delle strategie e dei modelli della rete non ancora noti. Quando Google è stata fondata nel 1997 nessuno nell’ambiente scientifico sapeva ad esempio che il World Wide Web seguisse comportamenti come i modelli a invarianza di scala. Quando il modello a invarianza di scala diventò il punto di riferimento, alcuni anni dopo (2000) si è poi iniziato a comprendere che il modello di per sé pur valido, non poteva spiegare tutti i fenomeni del comportamento del WWW.

In sintesi Google tenta di avvantaggiarsi rispetto alla concorrenza creando i presupposti per sfruttare quelle non linearità nel modello a invarianza di scala che permette a hub meno recenti di avvantaggiarsi contrastando la regola del “preferential attachment

Detto questo, alcuni comportamenti del calcolo del
PageRank possono essere dati per assodati.

Cito i 5 fattori piu’ importanti che influenzano il PageRank descritti proprio da Lawrence Page:

1. Visibilità di un Link
2. Posizione di un Link all’interno di un documento
3. Distanza di tra le pagine
4. Importanza di una pagina linkata
5. Aggiornamento di una pagina linkata

Ecco perche’ quanto Armando dice nel punto 3) e successivi è vero. Link interni (o tra pagine poco distanti tra loro come ad esempio due siti sullo stesso server)

Per il punto 5 è tutto da verificare! Secondo me bisognerebbe in questo caso parlare in termini di probabilità. Il numero di link da siti esterni aumenta la popolarità e la visibilità di un sito. Questo è innegabile! Ma quanto “peso stastistico” devo dare a questo fattore? Quanto la visibiltà di un link può essere determinante rispetto ad altri fattori concomitanti?
Una caratteristica non spiegata dal modello di rete a invarianza di scala è che quando per esempio aggiungo alla mia pagina Web un link verso creo un link interno fra due nodi vecchi!

Inoltre come giustamente dice Armando nel punto 2) il PageRank dipende solo in piccolissima parte da Link ipertestuali interni. Anzi di più: è importante che le due pagine non risiedano sullo stesso server, giudicato dal PageRank pagine “vicine tra loro”.


Nessun commento: