¿Cómo funcionan los motores de búsqueda?

Los motores de búsqueda son una parte integral de nuestra vida diaria.

La mayoría de nosotros estamos familiarizados con ‘Google’ . ¿Cómo hornear un pastel? ¿Dónde vive mi actor favorito? ¿Quién escribió este libro? ¿Cuáles son las últimas tendencias en moda? Y más preguntas son respondidas por nuestro amigable ‘Google’.
Google es uno de los muchos motores de búsqueda disponibles en la actualidad que ‘exploran’ en Internet y nos presentan la información más relevante y valiosa.

Ahora entendamos, ¿cómo funcionan estos motores de búsqueda?

Básicamente todos los motores de búsqueda pasan por tres etapas :

  • gateando
  • Indexación
  • Clasificación y recuperación

Rastreo
Esta etapa implica escanear los sitios y obtener información sobre todo lo que contiene: título de la página, palabras clave, diseño, páginas a las que se vincula, como mínimo.

Esta tarea la realizan robots de software especiales, llamados “arañas” o “rastreadores” .

Estos robots generalmente comienzan con los servidores más utilizados y las páginas web más populares. La estructura de enlaces es muy importante para determinar la ruta que siguen estos “rastreadores”. Los nuevos enlaces se siguen a continuación para encontrar muchos documentos interconectados, y también se vuelve a visitar los sitios anteriores para verificar los cambios realizados recientemente. Un proceso interminable.

A veces, los «rastreadores» se dan por vencidos, si el contenido real está oculto a muchos clics de distancia de la página de inicio.

Indexación
Una vez que se han asimilado todos los datos, las partes seleccionadas se almacenan en enormes instalaciones de almacenamiento. Podemos relacionarnos de esta manera: poseemos varios número de libros. Revisar todo es el rastreo , y hacer una lista de ellos, junto con sus autores y otra información relacionada es la indexación .

Este ejemplo proporciona una vista a pequeña escala.

Si ampliamos esta suposición a los libros contenidos en todas las bibliotecas del mundo, eso explica bastante la magnitud que asume un motor de búsqueda.

Clasificación y Recuperación
Los motores de búsqueda son máquinas contestadoras. Cada vez que realizamos una búsqueda en línea, los motores de búsqueda recorren su base de datos en busca de los resultados más relevantes. Además, clasifica estos resultados según la popularidad de los sitios web. La relevancia y la popularidad son los factores más importantes que deben tener en cuenta estos motores de búsqueda para proporcionar un rendimiento satisfactorio.

Los algoritmos de clasificación difieren para los diferentes motores de búsqueda. Un motor puede asignar un peso a cada entrada, en relación con su aparición en el título, las metaetiquetas o los subtítulos.

El algoritmo más básico utiliza la frecuencia de la palabra clave que se busca. Esto, sin embargo, condujo a algo llamado «relleno de palabras clave» , donde las páginas se llenan en su mayoría con tonterías siempre que incluyan la palabra clave.
Esto dio paso al concepto basado en la vinculación: los sitios más populares estarían más vinculados.

En la actualidad, los motores de búsqueda están tratando de desarrollar consultas en lenguaje natural . Poder entender lo que hablamos, de manera libre, revolucionará verdaderamente esta tecnología. Un sitio de consulta de lenguaje natural popular hoy en día es AskJeeves.com , pero prefiere consultas simples. El tiempo daría lugar a mejores motores de búsqueda que acepten consultas complejas.

Referencias del sitio web:
http://computer.howstuffworks.com/internet/basics/search-engine.htm https://moz.com/beginners-guide-to-seo/how-search-engines-operate

Este artículo es una contribución de Nihar Ranjan Sarkar . Si le gusta GeeksforGeeks y le gustaría contribuir, también puede escribir un artículo usando contribuya.geeksforgeeks.org o envíe su artículo por correo a contribuya@geeksforgeeks.org. Vea su artículo que aparece en la página principal de GeeksforGeeks y ayude a otros Geeks.

Escriba comentarios si encuentra algo incorrecto o si desea compartir más información sobre el tema tratado anteriormente.

Publicación traducida automáticamente

Artículo escrito por GeeksforGeeks-1 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *