Funcionamiento de los Motores de Búsqueda y Tecnología de Google

jueves, 16 de octubre de 2008 | 09:00

Los motores de búsqueda permiten a los usuarios encontrar la información que están buscando entre los miles de millones de páginas webs existentes. Sin los motores de búsqueda estaríamos limitados a encontrar información escribiendo en un navegador los nombres de dominios de las páginas web que conocemos y buscando dentro de cada página la información que realmente nos interesa. Esto limitaría significativamente nuestras opciones, desaprovechando así la mayor herramienta de información y conocimiento que la humanidad haya visto hasta el momento. Los motores de búsqueda han sido una herramienta fundamental para el desarrollo de Internet, e Internet no sería la misma sin ellos.

Muchas veces los reclamos dirigidos a los motores de búsqueda u otros intermediarios de Internet, obedecen al desconocimiento de cómo funcionan sus tecnologías.

Los motores de búsqueda están conformados por 3 elementos:


1. Un programa de computación que recorre constantemente la red Internet recabando información sobre las páginas que se encuentran publicadas en los servidores de Internet Sin embargo, ciertos sitios de Internet pueden optar por no ser indexados por los restos programas (llamados robots) mediante la inclusión de un protocolo de exclusión que hará que no sea indexado.

2. Un programa de computación, que analiza la información recabada por el robot, la compila y genera un índice sobre la base de algoritmos que permiten ordenar la información siguiendo criterios de relevancia.

3. Un programa de computación que le permite a los usuarios realizar búsquedas sobre el índice generado.

Los motores de búsqueda son el equivalente tecnológico a los catálogos por fichas de las bibliotecas. Los motores de búsqueda son tecnologías neutrales. Todo el proceso de recopilación, compilación e indexación y búsqueda se realiza de manera automática sin intervención humana. La única intervención humana está dada por el usuario que ingresa los términos a buscar.

Es importante destacar que los motores de búsqueda no seleccionan “algunos” contenidos, sino que intentan indexar todo aquel contenido que se encuentra disponible en la Web. Un buen motor de búsqueda es el que refleja mejor la realidad de la Web y muestra más contenidos.

En síntesis: Los intermediarios no tienen facultades de edición sobre los contenidos y no pueden ser asimilados a un editor de un diario.

Los motores de búsqueda no generan ningún tipo de contenido, solamente se limitan a mostrar los contenidos que han sido generados por terceros y que se encuentran publicados en diferentes servidores de Internet sobre los cuales los buscadores no tienen control alguno.

A diferencia de otros sitios como Wikipedia o un diario en línea, el buscador de Google no tienen contenido propio, se trata solamente de una herramienta que sirve para encontrar contenido de terceros.

Los resultados se determinan sin intervención ni manipulación humana. Las posiciones en los resultados de búsqueda se determinan basándose en un conjunto de factores objetivos.


Contenidos que afectan a los usuarios

Cuando un usuario detecte que los resultados de una búsqueda determinada, remiten a contenidos que puedan afectar sus derechos o derechos de terceros, deberá dirigir sus reclamos a quien haya sido el generador de estos contenidos.

Es importante tener en cuenta que este tipo de contenidos no son generados por los motores de búsqueda. Los motores de búsqueda solamente muestran la información que existe publicada en Internet, no tienen control sobre la misma y por lo tanto no son ni pueden ser responsables por las mismas.

El supuesto contenido lesivo se encuentra en el servidor de Internet que aloja la página en cuestión. La forma adecuada de proceder a la remoción de un contenido que se considere lesivo es remover el contenido en su origen, responsabilizando al autor del mismo.

Una vez que los contenidos hayan sido removidos de los servidores de Internet donde se encuentran alojados, los motores de búsqueda no los indexarán y por ende no se mostrarán en los resultados de búsqueda.

Los motores de búsqueda permiten a los usuarios detectar contenidos lesivos. Si un contenido no es accesible a través del buscador pero continúa online, es posible promover un mercado paralelo de contenidos e imágenes ilegales, más difícil de combatir.


La Tecnología de Google

La misión de Google, consiste en organizar información proveniente de todo el mundo y hacerla accesible y útil de forma universal.

Para lograr esto Google ha desarrollado la innovadora tecnología PageRank™, que ha revolucionado la forma de realizar búsquedas. PageRank realiza una valoración objetiva de la importancia de las páginas web resolviendo una ecuación de más de 500 millones de variables y 2.000 millones de términos, para examinar toda la estructura de vínculos de la web e identificar las páginas más importantes. En lugar de contar los vínculos directos, PageRank interpreta un vínculo de la página A a la B como un voto para la página B por parte de la A.

A continuación, valora la importancia de la página en cuestión contando la cantidad de votos recibidos. Esta tecnología también tiene en cuenta la importancia de cada página que efectúa un voto, dado que los votos de algunas se consideran de mayor valor, con lo que incrementan el valor de la página con la que enlazan. Las páginas importantes reciben un PageRank más elevado y se sitúan entre los primeros resultados.

Google combina la importancia global con la relevancia respecto a las consultas para presentar en primer lugar los resultados más relevantes y fiables.

La tecnología de Google utiliza la inteligencia colectiva de Internet para determinar la importancia de una página. Los resultados se determinan sin intervención ni manipulación humana. Éste es el motivo de la confianza de los usuarios, que consideran Google una fuente de información objetiva no tergiversada por motivos económicos.

Google ofrece a los usuarios acceso a un índice compuesto por más de 8.000 millones de URL (páginas Web). Por estos motivos resulta técnica y humanamente imposible hacer un control activo de todas estas páginas Web, donde muchas de ellas se actualizan diariamente.


Pedro Less Andrade. Gerente de Asuntos Gubernamentales y Políticas Públicas, Latinoamérica. Google Inc.