domingo, 14 de abril de 2013

Porque el orden de los factores SÍ altera el producto

Siendo sinceros con nosotros mismos, a la hora de realizar una búsqueda en Internet, ¿solemos por lo general llegar a pulsar el botón “Siguiente” situado al final de la primera página que nos muestra nuestro fiel aliado Google? Y aún más, ¿habitualmente consultamos otros que no sean los cuatro primeros enlaces que nos sugiere este motor de búsqueda antes de haber cambiado ya el nombre de aquello que buscamos, por si especificar algo mejor nos augura un poco más de suerte?


Seamos realistas, acudimos a la red en busca de soluciones, de respuestas, rápidas, casi instantáneas, y no queremos dedicar a su averiguación más que unos breves segundos, un mero deslizar de la vista por la pantalla en pos de las cuatro palabras clave que ¡oh! en fabulosa conjunción formen lo que estamos buscando. Y ellos lo saben. Y por eso Google es hoy en día el buscador más utilizado a nivel mundial: rara vez nos hará perder el tiempo, si existe referencia en Internet sobre lo que estamos buscando lo vamos a encontrar, y descuidémonos, será al primer golpe de vista. 

Esta gran ventaja se debe a la política del PageRank, una marca registrada y patentada por Google el 9 de enero de 1999, pues fue desarrollada por sus fundadores Larry Page (al que debe el nombre) y Sergey Brin, en la Universidad de Stanford. Un sistema que ampara una familia de algoritmos utilizados para asignar de forma numérica la relevancia de los documentos (o páginas web) indexados por un motor de búsqueda, determinando la importancia de una página. No obstante, sus propiedades son muy discutidas por los expertos en optimización de motores de búsqueda. 

PageRank confía en la naturaleza democrática de la web utilizando su vasta estructura de enlaces como un indicador del valor de una página en concreto. Google interpreta un enlace de una página A a una página B como un voto, de la página A, para la página B; pero también analiza la página que emite el voto. Los votos emitidos por las páginas consideradas "importantes"—con un PageRank elevado—valen más, y ayudan a hacer a otras páginas "importantes".



El peso o importancia de una página es el resultado de una "votación" entre todas las demás páginas de la World Wide Web acerca del nivel de relevancia que tiene esa página. El PageRank de la barra de Google aparece en valores de 0 a 10, siendo muy pocos sitios web los que gozan con la calificación máxima de diez, una gran mayoría de sitios web normales los que reciben la calificación mínima de uno, y aquellos con cero los que o bien han sido penalizados o aún no han recibido una calificación de PageRank. Un hiperenlace a una página cuenta como un voto de apoyo, influyendo junto a otros enlaces y con su propio valor en la valoración de la página con la que esté relacionada. Una página que está enlazada por muchas páginas con un PageRank alto aumenta el propio, del mismo modo que si no hay enlaces a una página web, esta carece de apoyo. 



El PageRank se va actualizando varias veces al año, y tarda varios días en completarse

Debido a la importancia comercial que tiene aparecer entre los primeros resultados del buscador, se han diseñado métodos de manipulación del PageRank de una página, entre ellos destaca el spam, que consiste en añadir enlaces a cierta página web desde lugares como blogs, libros de visitas, foros de Internet, etc. con la intención de incrementar el número de enlaces que apuntan a la página. Debido a esto en 2005 Google implementó un nuevo atributo para hiperenlaces que inhibía en el cálculo del PageRank a los links que lo contuvieran.

Para concluir la entrada, aludiré a los, bajo mi opinión, más interesantes Mitos sobre PageRank que en la página oficial (www.page-rank.es) se dedican a desmontar, aclarando ciertos puntos sobre su funcionamiento: 

1. El valor del PageRank es de 0 a10 
Se tiende a creer que el valor del PageRank es un número entero, pero en realidad es un número real muy elevado, por lo que se utiliza un número entero para mostrar el PageRank en la barra de Google.

2. El PageRank mostrado en la barra de Google es el usado para los resultados de búsquedas 
Cada dos o tres meses el PageRank es actualizado, pero eso no quiere decir que Google no posea datos más actualizados que los que muestra, por eso a menudo el valor de la barra no concuerda con el real que Google utiliza para posicionar mejor o peor una página en las búsquedas.

3. PageRank es el primer factor a la hora de posicionar los resultados de búsqueda 
No exactamente, pese a que el PageRank es y fue la espina dorsal de Google como motor de búsqueda, los años han pasado y la tecnología de Google ha evolucionado, y ahora Google utiliza un gran número de factores para posicionar los resultados de sus búsquedas, aunque nadie del exterior de las oficinas de Google conoce qué factor pesa más.

7 comentarios:

  1. En mi opinión gran artículo, se nota que te has informado bien sobre el tema. Estoy de acuerdo en todo básicamente, ya que también opino que nadie se molesta en mirar más allá de la tercera web web que Google nos muestra, incluso ya sería mucha suerte que alguien mirase la última web de la primera página.

    Sin embargo este es un buen sistema para acceder al, en teoría, mejor contenido, y no perder el tiempo en páginas que no valen la pena. Por otro lado, también lo veo como un sistema que dificulta que las nuevas páginas vayan aumentando popularidad, ya que siempre estarán por detrás de las wikipedias de turno, y mucha información decente queda desperdiciada.

    ResponderEliminar
  2. El PageRank de Google es el motor de búsqueda que todos los usuarios del afamado buscador damos por supuesto. Como bien ha relatado Cristina, tan solo nos limitamos a leer los primeros enlaces que aparecen tras realizar una búsqueda mientras que los que se encuentran más allá de la cuarta línea caen en el olvido. De esta manera, inconscientemente, estamos seleccionando la información que deseamos obtener de la previa criba que ha realizado el PageRank de Google. Por así decirlo dependemos de él para nuestras búsquedas si deseamos tener éxito en las mismas.

    Por otro lado, como ha comentado Eduardo, esto puede provocar que ciertas páginas con información de calidad sean relegadas a un segundo plano en otra página. Se pierde gran cantidad de información veraz y útil para el usuario por el simple hecho de no haber sido votado y, en cambio, aparece entre los dos/tres primeros links el que te lleva a la información de Wikipedia, de dudosa reputación.

    En resumen, habría que encontrar un equilibrio entre este sistema y un sistema de expertos que valorara la información y por tanto su difusión. Como apuntamos en clase, mucha información se ve desperdiciada por no aparecer en los primeros enlaces de Google. Éste es un buscador de tamaño mundial del que todos hacemos uso a diario pero sin darnos cuenta estamos utilizando el criterio de PageRank del mismo que en algunos casos resulta engañoso.

    ResponderEliminar
  3. Ciertamente estamos ante un tema tan interesante como polémico. A pesar de que todos suponíamos a Google como un sistema inteligente capaz de situarnos en primer lugar aquéllo que buscamos, pocos nos paramos a pensar en como el buscador consigue hacerlo. Gracias a este artículo, se puede comprobar que es el resultado de un complejo sistema, el Page-rank, pero tal y como muestra nuestra compañera Cristina al final del artículo, aderezado con otras herramientas.

    Es indiscutible que este mecanismo ha facilitado enormemente el uso de Internet y la labor de sus usuarios. Desde mi punto de vista, es el cerebro que ordena la gran masa de información caótica que circula por Internet, desde el punto de vista de la popularidad y la importancia. Por supuesto, para confiar en el Page-rank debemos partir de que los usuarios somos seres racionales e inteligentes, característica que personalmente creo que sí se cumple.

    Únicamente pondría una pega a este mecanismo: Google debería desarrollar un canal de recepción de quejas de quien se sienta afectado por el sistema. Como vimos en clase, cuando buscamos "ladrones" Google nos sitúa en primer lugar SGAE, y esté o no justificado, si un servidor fuese miembro de la Sociedad no estaría de acuerdo. También se ha dado el caso de autores que han escrito grandes e importantes artículos y que hasta en Google Docs y Google Academy se han visto desplazados a la decena de páginas atrás por resultados repetitivos de "mejores frases del profesor X" o "teléfono, dirección y fotos del profesor Y". Quizá esa audiencia abierta sea el ingrediente que falta a este complejo sistema para terminar de perfeccionarlo.

    ResponderEliminar
  4. Es indiscutible que necesitamos la ayuda de un buscador a la hora de filtrar la ingente cantidad de información que conforma la Red hoy en día. Sin embargo, sí que puede surgir la polémica al preguntarnos: ¿son los más apropiados los criterios elegidos por Google a la hora de establecer el PageRank de una página?

    Como hemos podido comprobar, Google se rige por elementos como la cantidad de enlaces que te nombran y la relevancia de quien lo hace, tu antigüedad, si actualizas con frecuencia, etc. No se puede decir que sean criterios erróneos pero ello no quita que acabemos la mayoría de las veces en la Wikipedia, pudiendo haber una página menos popular o de reciente creación que contenga una información más específica de lo que estamos buscando. Esto nos hace pensar si realmente estamos seleccionando la información que deseamos o simplemente estamos siendo conducidos por los sitios de siempre y perdiéndonos la multiplicidad de opciones que nos ofrece Internet.

    También me gustaría añadir que hay formas para atajar y aparecer en lo más alto de las búsquedas de Google dejando de lado el PageRank. Y es que hoy en día, como para casi todo, puedes saltarte unos cuantos pasos y ahorrar tiempo si tienes el dinero necesario para ello, como es el caso de los anuncios recomendados.

    Así que en efecto, el PageRank es un elemento necesario para agilizar nuestras búsquedas, pero solo queda preguntarse si su mecanismo es el más efectivo.

    ResponderEliminar
  5. La sociedad en la que vivimos hoy en día, es la sociedad de las prisas. Si tenemos algún problema, queremos encontrar su solución al momento. Si buscamos información, queremos obtenerla lo más rápidamente posible.
    De ahí que cada vez utilicemos menos la reflexión y el análisis como métodos de pensamiento, y nos precipitemos muchas veces, tomando como válidas informaciones que se nos brindan en internet.
    Esto ha sido propiciado por los avances tecnológicos.
    No quiero decir con ello que esté con contra del progreso informático, pero sí es cierto que la tecnología nos mejora la vida, pero por otro lado, nos da "hechas" muchas cosas que casi sin pensar damos por buenas.
    Es cierto lo que nos comenta Cristina, nadie va más allá del tercer o cuarto enlace que nos ofrece Google porque siempre pensamos que son los mejores lugares de la red para consultar y encontrar nuestra información, solo porque sean los sitios más visitados, y esto me hace pensar si realmente nosotros seleccionamos, o somos conducidos de una manera premeditada a los enlaces a los que Google quiere hacernos llegar.
    Reflexionemos sobre ello.

    ResponderEliminar
  6. Sinceramente, estoy sorprendido viendo cómo funciona el motor de búsqueda de Google, la verdad es que alguna vez me lo había planteado pero nunca indagué demasiado. En cuanto a Page Rank, lo único que tengo que decir es que me parece mal que por motivos comerciales aparezcan en primer lugar páginas webs que no nos interesan para nada y poco tienen que ver con la búsqueda pero ¡aaaah! ¡Qué poderoso es don dinero! Ese quizás sería el único inconveniente que encontraría porque la verdad es que funciona realmente bien ya que en una mayoría aplastante de veces encuentra y posiciona en primer lugar aquello que busco.

    ResponderEliminar
  7. Como bien dice Nando, hay cosas que, por desgracia, jamás cambiarán. Y una de ellas es el hecho de que quien paga, manda, y en el caso del tema que nos ocupa ello se traduce a que quien paga, se sitúa por delante, el primero, en el buscador de Google. Por ello creo que es nuestra responsabilidad huir de la posición comodona de pinchar en el primer enlace al que nos conduce el buscador y optar por el contraste de fuentes, que, por otra parte, es un axioma esencial de la profesión para la que nos estamos formando. Y esta idea está a su vez muy relacionada con lo que comenta Pablo: ello nos haría más autónomos. No olvidemos que nosotros debemos ser quienes decidamos cuál es la mejor información, no dejemos que Google nos quite ese derecho por mera comodidad.

    ResponderEliminar