¿Qué es el motor de búsqueda y el ranking de páginas de Google?

Personas de todo el mundo recurren a los motores de búsqueda para hacer preguntas triviales, dudas de vital importancia y encontrar una respuesta casi de inmediato. Buscar es una de las acciones más utilizadas en Internet. Los motores de búsqueda como instrumento de búsqueda son sitios muy populares y de uso frecuente en Internet. Un motor de búsqueda es un programa basado en la web que está diseñado para buscar y organizar el contenido de la enorme base de datos de recursos que llamamos la red mundial. Por lo general, para acceder a la información, el usuario necesita conocer la ubicación exacta del sitio web almacenado en la base de datos, es decir, la URL del sitio web.

Search-Engines-and-Page-Ranking

Este trabajo de encontrar la URL lo realiza el motor de búsqueda. Cuando se envía una solicitud al motor de búsqueda, devuelve las direcciones o enlaces a los sitios web que el usuario deseaba visitar o algo relevante para la consulta solicitada. Cuando el motor de búsqueda encuentra contenido relevante en el artículo, hay millones de sitios y los resultados obtenidos dependen de la búsqueda que esté utilizando el usuario y los algoritmos utilizados por esos motores de búsqueda para dar los mejores resultados.

¿Cómo empezó todo?

La tecnología de Internet había dado un salto cuántico en la transferencia de información desde diferentes lugares en muy poco tiempo. Internet había supuesto una revolución en la forma de vida de la gente. Hoy no podemos imaginar un día sin internet. Cuando la tecnología de Internet se puso a disposición del público, que se inició principalmente como un proyecto de red de defensa, solo había 2800 sitios web. Solo había motores de búsqueda básicos como ARCHIE en 1994 que pueden llevar al usuario a un sitio web específico. Aquí, el usuario tenía que conocer el nombre de dominio del sitio web que desea visitar y enviar una solicitud al servidor de solicitud de DNS que encuentra la dirección IP asociada que se utiliza para conectarse al servidor del sitio web que el usuario solicitó.

How-Search-Engine-Started

Pero a fines de 1995, había alrededor de cien mil sitios web y es casi imposible conocer los nombres de dominio de cada sitio web. Tendemos a olvidar que Internet no trajo consigo mágicamente la capacidad de encontrar cualquier cosa en esta red informática gigante hasta que algunas personas inteligentes decidieron que la información en Internet sería mucho más útil si estuviera fácilmente disponible. Fue entonces cuando nació el concepto de motores de búsqueda.

Después de 1995, ocurrieron muchos desarrollos y cambios en el mundo de los motores de búsqueda. Incluso los sitios web comenzaron a diseñar sus páginas agregando contenido útil y relevante de acuerdo con el motor de búsqueda específico. Entonces, los motores de búsqueda comenzaron a buscar sitios web utilizando programas bot llamados rastreadores web o arañas. Estos son programas web que visitan y buscan en el contenido del sitio, imágenes, otras páginas a las que están vinculados e indexan esas páginas con los enlaces. Estos eran más como un diccionario indexado, pero no un motor de búsqueda real que pudiera ofrecer los mejores resultados. Además, algunas empresas como Yahoo categorizaron los sitios manualmente como querían y perdieron popularidad porque no pudieron seguir el ritmo de los otros motores de búsqueda. Si hay algún error ortográfico, habría resultados muy diferentes y podría terminar en sitios de spam.

¿Cómo funcionan los motores de búsqueda?

Los motores de búsqueda modernos funcionan de forma mucho más diferente que los del pasado. Utilizan algoritmos de búsqueda avanzada para optimizar el resultado y ofrecer los mejores resultados a sus usuarios. Cuando el usuario realiza una consulta en el motor de búsqueda, el motor de búsqueda en realidad no ejecuta un programa para rastrear toda la web mundial en tiempo real. La razón para no hacer esto es simplemente por el hecho de que actualmente hay más de mil millones de sitios web listados en Internet y se agregan 380 cada minuto. Si el motor de búsqueda busca en cada sitio para encontrar el que el usuario desea visitar, tomaría una eternidad.

Por lo tanto, para que la búsqueda sea más rápida, los motores de búsqueda escanean constantemente los sitios web con anticipación para almacenar la información que podría ayudar con la búsqueda del usuario más adelante. Funciona por el hecho de que Internet es una red de páginas conectadas por hipervínculos. Con la ayuda de estos enlaces, los rastreadores pueden saltar de un sitio a otro con facilidad y de este al siguiente y el proceso itera hasta que un montón de ellos son visitados y marcados. Para entregar los resultados a la velocidad de la luz a los usuarios, los motores de búsqueda ejecutan constantemente programas de bots como arañas que rastrean estos sitios web para recopilar la información que consideran importante para los usuarios. Cada vez que encuentra un hipervínculo, sigue y almacena la información incluso desde ese sitio y continúa hasta que ha visitado todas las páginas que puede encontrar desde esa página web inicial. Para cada sitio que visita, registra cualquier información que necesita para una búsqueda añadiéndola a una base de datos especial llamada índice de búsqueda que contiene toda la información sobre un sitio web que se utiliza para obtener los resultados de la búsqueda. Entonces, cuando el usuario busca algo, ya sabe su respuesta en ese índice.

Los motores de búsqueda modernos se han vuelto muy avanzados en estos días y no solo buscan en las palabras que escribimos en la barra de búsqueda, sino que también entienden más que solo strings. Entienden lo que significan esas palabras para encontrar la mejor coincidencia que el usuario está buscando. Para comprender mucho mejor las palabras ingresadas por el usuario, estos motores de búsqueda modernos utilizan el aprendizaje automático, un tipo de Inteligencia Artificial. Esto permite que los algoritmos busquen no solo palabras clave individuales, sino que también comprendan el significado subyacente de estas palabras. Por lo tanto, lograr el objetivo de entregar información al usuario con solo unas pocas pulsaciones de teclas.

Abordar un problema: Además, incluso este método tiene otro problema importante cuando se realiza una búsqueda, el motor de búsqueda analiza cada una de esas palabras en el índice de búsqueda para obtener de inmediato la lista de todas las páginas en Internet relevantes para esas palabras. Pero este método podría devolver algunos millones de páginas que contienen esas palabras clave. Por lo tanto, surge un gran problema cuando el motor de búsqueda necesita determinar el resultado que mejor se adapta al usuario. En otras palabras, el motor de búsqueda necesita clasificar sus resultados, lo que conduce al desarrollo del algoritmo de clasificación de páginas.

¿Qué es el ranking de páginas?

La clasificación de páginas es un algoritmo de clasificación que califica la importancia de un sitio web en función de lo que el algoritmo cree que el usuario desea más. Lleva el nombre de Larry Page, uno de los fundadores de Google. Este algoritmo es el núcleo del motor de búsqueda de Google. Pero solo Google y muchos otros motores de búsqueda como Bing de Microsoft también han desarrollado sus propios algoritmos diferentes para clasificar páginas. Google fue pionero en este algoritmo para elegir los resultados más relevantes para una búsqueda teniendo en cuenta cuántos otros sitios web están vinculados a una página determinada y qué tan importantes son esas otras páginas. La idea básica era que si muchos sitios web se vinculan a un solo sitio, ese sitio web podría ser el que el usuario podría estar buscando y ese es el más probable que el usuario quiera en sus resultados de búsqueda. También,

Larry Page lo inició por primera vez en su universidad para determinar la importancia de un trabajo de investigación. si hay más artículos que citan un artículo, entonces ese artículo tiene mayor importancia y es el que está buscando. La clasificación de páginas funciona de manera similar al contar la cantidad y la calidad de los enlaces que dirigen a una página para determinar aproximadamente la importancia de un sitio web, suponiendo que es probable que los sitios web más importantes reciban más enlaces de sitios web externos. En términos sencillos, el Page Rank es el voto de todos los demás sitios web sobre la importancia de un sitio web. Si un sitio web se vincula a otro sitio externo, simplemente está votando por ese sitio web y un sitio web que recibe enlaces, entonces está siendo votado por otros.

En términos técnicos, Page Rank (PR) es un algoritmo de análisis que asigna una ponderación numérica a cada elemento de los documentos hipervinculados en la web con el único propósito de medir la importancia relativa. Este peso numérico se conoce como PR o rango de página. Esto representa la probabilidad de que un usuario haga clic aleatoriamente en los enlaces. Al tener la clasificación de página más alta, un sitio web será el primer resultado que se mostrará en caso de una búsqueda relevante realizada por el usuario.

Ejemplo: supongamos una situación en la que un usuario busca el libro «Una breve historia del tiempo» de Stephen Hawking. Considere los siguientes sitios web como “amazon.com”, “astroboy.com”, “booky.com”, “originalreviewer.com”.
Supongamos que el libro que el usuario quería comprar fue revisado por muchos sitios web que revisan libros de forma rutinaria y sugieren a sus usuarios el mejor lugar para comprar ese libro al mejor precio, como «amazon.com». Si otros artículos y blogs de revisores famosos recomiendan «amazon.com» colocando un enlace para eso en su sitio web. Además, está vinculado indirectamente por otros sitios web, ya que están vinculados a los sitios web de estos sitios web de revisión. Dado que muchos sitios web se vinculan a «amazon.com», su peso o PageRank aumenta, lo que lo hace más importante y relevante para el usuario. Por lo tanto, cuando el usuario busque el libro en el motor de búsqueda, el primer resultado que probablemente aparecerá será “amazon.com”.

Page-Ranking-Example

Los motores de búsqueda se han convertido en una parte integral de la sociedad moderna. La gente siempre usa motores de búsqueda para obtener respuestas a sus consultas. En promedio, los motores de búsqueda como Google procesan más de 40 mil requests por segundo, lo que equivale a 3500 millones de búsquedas por día. Hemos pasado de buscar palabras clave en un directorio a un nivel en el que podemos obtener la dirección de un restaurante cercano sin siquiera especificar la ubicación del usuario, ya que el motor de búsqueda ya recopila datos personales para entregar los resultados de manera más rápida y precisa.

Los motores de búsqueda ofrecen a sus usuarios grandes e impresionantes cantidades de información disponible con una velocidad y comodidad que pocas personas podrían haber imaginado hace unos años. Los algoritmos de los motores de búsqueda se actualizan oportunamente para mejorar la velocidad de entrega y la precisión de los resultados. Los motores de búsqueda se destacan como los sitios web más utilizados en todo el mundo y las empresas que los poseen ganan miles de millones cada año. Pero todos estos motores de búsqueda están sirviendo mucho a la gente, pero la gente sabe poco o nada acerca de cómo funcionan y cuán complejos son. de hecho, no necesitan hacerlo.

Publicación traducida automáticamente

Artículo escrito por HemanthKollipara y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *