venerdì 23 febbraio 2007

I 5 fattori più importanti che influenzano il calcolo del PageRank

Citiamo qui (secondo un articolo pubblicato su The Daily Bit) i 5 fattori più importanti che influenzano il calcolo della link popularity di un nodo descritti proprio da Lawrence Page (uno dei fondatori di Google e ideatore del PageRank):

1. Visibilità di un Link
2. Posizione di un Link all’interno di un documento
3. Distanza di tra le pagine
4. Importanza di una pagina linkata
5. Aggiornamento di una pagina linkata

Una caratteristica non spiegata dal modello di rete a invarianza di scala è che quando aggiungiamo alla mia pagina Web un link verso, ad esempio, una pagina di questa rivista on line, creiamo un link interno fra due nodi vecchi!

Luis Amaral e Gene Anely della Boston University [1] e due studenti hanno dimostrato proprio questo: che i nodi, invecchiando, perdono gradualmente la loro capacità di annettersi dei link.
I due studenti del gruppo (Mendes e Dorogovtsev) hanno dimostrato poi che l’invecchiamento non distrugge le leggi di potenza, ma altera semplicemente il numero di hub perché cambia il loro esponente in grado.

Cioè come dire che la regola del collegamento preferenziale (preferential attachment) segue un meccanismo più complesso: la probabilità che un nuovo nodo si colleghi a uno già esistente non dipende unicamente dal numero di link ma anche dall’aggiornamento e dalla distanza tra le pagine.

Ecco perché ad esempio metodi di calcolo come il PageRank di una pagina sono influenzati solo in piccolissima parte da Link ipertestuali interni. Anzi di più: è importante che le due pagine non risiedano sullo stesso server, giudicato dal PR come pagine “vicine tra loro”.



[1] Il lavoro sull’invecchiamento condotto dal gruppo dell’Università di Boston è stato pubblicato in L.A. Amaral, A. Scala, M. Barthélémy e H.E. Stanley, Classes of Small-World Networks, in “Proceedings of the National Academy of Sciences”, 97 (2000). pp. 1149-152

Nessun commento: