Cómo se gestó en Google la idea de PageRank

02 Ago Cómo se gestó en Google la idea de PageRank

¿Qué sabemos de esa barrita verde de Google? El Pagerank (PR) es un valor numérico que representa la importancia que una página web tiene en Internet. Este sistema fue creado por los fundadores de Google tal y como nos cuenta Richard L. Brandt en su libro Las dos caras de Google, de la Editorial Viceversa.

[…] Cuando en diciembre de 1998 se presentó oficialmente el motor de búsqueda Google, éste poseía una característica importante y única: funcionaba. Su corazon es el PageRank System, creado por Larry mientras trabajaba en su doctorado, y al que bautizó a partir de su apellido. Saca provecho de las excepcionales propiedades de la Red: el entramado de conexiones que hace tan apropiado su nombre.

García-Molina recuerda cómo empezó todo. Era el director de doctorado de Larry Page. Un día, éste entró en su oficina para enseñarle el ingenioso truco que había descubierto. El motor de AltaVista no sólo recopilaba palabras clave de sitios, sino que también podía mostrar qué otros sitios estaban conectados entre ellos. AltaVista no explotaba esa información de los enlaces de la forma que Google lo haría después, pero ese día, Page sugirió que ésa sería una buena manera de ordenar los sitios según su importancia.

Larry Page había desarrollado una idea propia sobre el asunto de los enlaces. «Si es tan importante para nosotros, ¿por qué no hacemos que forme parte del proceso de búsqueda«, le dijo a García-Molina.

La idea de Larry se inspiraba en un detalle que conocía gracias a su educación dentro de un ambiente científico. Sabía que, entre los científicos cualquier documento de un investigador adquiere mayor credibilidad cuando es mencionado en el trabajo de otro investigador. Cuantas más veces ha sido citado, más importancia tiene entre la comunidad científica. Esta idea fue codificada en el Science Citation Book creado en 1960 por Eugene Gardfield, fundador del Institute for Scientific Information. Larry pensó que los enlaces de la web eran análogos a las citas científicas, y  que las páginas con más enlaces eran probablemente las más populares y serían las más útiles para los interesados. Ésos eran los sitios web que debían figurar en los primeros puestos de los resultados de cualquier búsqueda. Entonces empezó a crear su propio software para analizar los enlaces existentes entre las páginas.

Para conseguirlo, hacia falta una programación bastante ingeniosa. El sistema no tan sólo contaba los enlaces a un sitio en particular, sino que iba más allá, pues determinaba la importancia de los sitios vinculados. Esto se conseguía contando los enlaces un paso atrás en la cadena, lo que incrementaba enormemente la complejidad del análisis; a fin de calcular la importancia de un determinado sitio, el PageRank tenía que rastrear las conexiones dos pasos atrás y hallar la correlación entre esos datos y las palabras clave. Al principio, Larry bautizó el sistema como Backrub, jugando con la frase «rascarse la espalda», ya que rastrea conexiones hacia atrás. Sin embargo, al final se decidió por llamarlo PageRank, un nombre más sofisticado, que jugaba con el doble sentido de su apellido, puesto que se puede interpretar como «Clasificador de páginas» o como «Clasificador de Page».

Fuente: Las dos caras de Google (2010), Richard L. Brandt, Editorial Viceversa. Libro recomendado.

No Comments

Sorry, the comment form is closed at this time.