2/2/09

El PageRank de Google

Que es el PAGERANK:

Pagerank es el algoritmo base desarrollado por google para poder determinar el posicionamiento de una web en el intrincado mundo de internet (obviamente desde el punto de vista del buscador google). A ciencia cierta no se sabe 100% su funcionamiento ya que es un secreto guardado bajo 7 llaves y mucha de la información que puedes encontrar en la web es nada mas que supocisiones y también aproximaciones al modelo matematico utilizado en la arquitectura del buscador.

Pagerank es la metodologia con la cual se le asigna la importacia a una web dentro del buscador y usualmente va desde 0 hasta un valor maximo de 10, y es uno de los factores que afectan a la posicion de una web en un resultado de una busqueda especifica (ojo no es el unico de los factores que afecta a una busqueda)

El algorimo original:

En diversos sitios (como wikipedia) podemos encontrar el algoritmo original con el cual se patento (9 de enero del '99) con el N° 6,285,999 “The Anatomy of a Large-Scale Hypertextual Web Search Engine".

Donde:

  • PR(A) es el PageRank de la página A
  • PR(Ti) es el PageRank de las páginas Ti que enlazan a A,
  • C(Ti) es el número de enlaces salientes de la página Ti;
  • d es un factor de amortiguación que tiene un valor entre 0 y 1.

Aunque este algoritmo es el inicial, se supone que ha evolucionado y se ha modificado, pretender predecir su comportamiento es bastante complicado e inexacto hasta el momento.

Como se calcula el pagerank (fuente http://www.hellogoogle.com/)

El algoritmo PageRank se calcula en función de varios parámetros, alguno de ellos son conocidos pero otros no lo son.

Dos de los parámetros conocidos son el número y la calidad de los enlaces entrantes a una página.

  • Google interpreta un enlace de una página A a una página B como un voto de la página A para la página B .
  • Google analiza también el page rank y el número de enlaces salientes de la página que emite el voto para ponderar su importancia.:
    • Cuanto mayor sea el PageRank de una web mayor importancia tendrá su voto.
    • Cuantos menos enlaces salientes tenga una web mayor importancia tendrá su voto.
  • Por tanto, el PageRank de una página se define recursivamente y depende de todas las páginas que la enlazan.
  • No todas los enlaces son tenidos en cuenta, incluso hay enlaces que pueden llegar a resultar perjudiciales. Son los llamados link farms, webs fraudulentas que comercian con links.
  • Los enlaces javascript no pueden ser tenidos en cuenta.
  • Los enlaces con un atributo nofollow indican a Google explicitamente que no sean tenidos en cuenta.

No hay comentarios:

Publicar un comentario