Supongamos que está trabajando en un proyecto que necesita raspado web, pero no conoce los sitios web en los que se va a realizar el raspado de antemano, en lugar de eso, debe realizar una búsqueda en Google y luego proceder de acuerdo con los resultados de búsqueda de Google en algunos sitios web. . En ese caso, necesita los resultados de búsqueda de Google para sus diferentes consultas.
- Una forma de lograr esto es usar la solicitud y la sopa hermosa que se discutió aquí en Implementación de Web Scraping en Python con BeautifulSoup .
- En lugar de poner tanto esfuerzo en una tarea trivial, se ha creado el paquete de Google. Es casi una solución de una sola línea para encontrar enlaces a todos los resultados de búsqueda de Google directamente.
- Usando el paquete de python google podemos obtener resultados de la búsqueda de google desde el script de python. Podemos obtener enlaces a los primeros n resultados de búsqueda.
La instalación
del paquete de Google tiene una dependencia de beautifulsoup que debe instalarse primero.
pip install beautifulsoup4
Luego instale el paquete de google
pip install google
Función requerida y sus parámetros
- query: string de consulta que queremos buscar.
- TLD: TLD significa dominio de nivel superior, lo que significa que queremos buscar nuestros resultados en google.com o google. en o en algún otro dominio.
- lang: lang significa idioma.
- num: Número de resultados que queremos.
- start: El primer resultado a recuperar.
- detener: El último resultado a recuperar. Use Ninguno para seguir buscando para siempre.
- pausa: Lapso de espera entre requests HTTP. Un lapso demasiado corto puede hacer que Google bloquee su IP. Mantener lapsos significativos hará que su programa sea lento, pero es una opción mejor y más segura.
- Retorno: Generador (iterador) que arroja las URL encontradas. Si el parámetro de parada es Ninguno, el iterador se repetirá para siempre.
Códigos de Python sobre cómo hacer una búsqueda en Google usando el script de Python
Ejemplo 1: google_search.py
Python
try: from googlesearch import search except ImportError: print("No module named 'google' found") # to search query = "Geeksforgeeks" for j in search(query, tld="co.in", num=10, stop=10, pause=2): print(j)
Producción:
Realicemos una búsqueda en Google manualmente y verifiquemos nuestro resultado.
Ejemplo 2: google_search.py
Python
try: from googlesearch import search except ImportError: print("No module named 'google' found") # to search query = "A computer science portal" for j in search(query, tld="co.in", num=10, stop=10, pause=2): print(j)
Producción:
Realicemos una búsqueda en Google manualmente y verifiquemos nuestro resultado.
Referencia: paquete Python de Google
Este artículo es una contribución de Pratik Chhajer . Si te gusta GeeksforGeeks y te gustaría contribuir, también puedes escribir un artículo usando write.geeksforgeeks.org o enviar tu artículo por correo a review-team@geeksforgeeks.org. Vea su artículo que aparece en la página principal de GeeksforGeeks y ayude a otros Geeks.
Escriba comentarios si encuentra algo incorrecto o si desea compartir más información sobre el tema tratado anteriormente.
Publicación traducida automáticamente
Artículo escrito por GeeksforGeeks-1 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA