En este artículo, repasaremos el enfoque del análisis de la búsqueda de Google en el lenguaje de programación Python.
Google no comparte el número exacto de búsquedas, pero se estima que se realizan 228 millones de búsquedas por hora o 5.800 millones de búsquedas por día. ¡Eso es realmente un número enorme! Hagamos un análisis de búsqueda de Google con la ayuda de python en función de las consultas de búsqueda.
El contenido del artículo:
- ¿Qué es Pytrends?
- Cómo instalar Pytrends
- Conéctese a Google
- Construir carga útil
- Interés a lo largo del tiempo
- Interés histórico por hora
- Interés por Región
- Mejores gráficos
- Consultas relacionadas
- Sugerencia de palabras clave
¿Qué es Pytrends?
Pytrends es una API de tendencias de Google no oficial utilizada en python. Ayuda a analizar y enumerar los resultados de búsqueda de Google más populares sobre un tema o tema específico, en función de diferentes regiones e idiomas.
¿Cómo instalar Pytrends?
Para usar esta API, primero debe instalarla en sus sistemas. Puede instalarlo fácilmente usando el comando pip install pytrends.
pip install pytrends
Conéctese a Google
Ahora, comencemos con la tarea de analizar las tendencias de búsqueda de Google importando las bibliotecas de Python requeridas. Primero, necesitamos importar pandas para crear un marco de datos. En segundo lugar, debemos conectarnos a Google ya que estamos solicitando los temas de tendencias de Google, por lo que para esto, debemos importar el método TrendReq de la biblioteca pytrends.request . Además, importaremos matplotlib, para visualizar los datos.
Python3
import pandas as pd from pytrends.request import TrendReq import matplotlib.pyplot as plt Trending_topics = TrendReq(hl='en-US', tz=360)
Construir carga útil
Ahora, crearemos un marco de datos de los 10 principales países que buscan el término » COMPUTACIÓN EN LA NUBE «. Para ello, utilizaremos el método build_payload, que permite almacenar una lista de palabras clave que desea buscar. En esto, también puede especificar el período de tiempo y la categoría desde la que consultar los datos.
Python3
kw_list=["Cloud Computing"] Trending_topics.build_payload(kw_list,cat=0, timeframe='today 12-m')
Interés a lo largo del tiempo
El método interest_over_time() devuelve los datos indexados históricos de cuándo se buscó más la palabra clave especificada de acuerdo con el período de tiempo mencionado en el método de carga útil de compilación.
Python3
Trending_topics.build_payload(kw_list=["Cloud Computing"], cat=0, timeframe='today 12-m') data = Trending_topics.interest_over_time() data = data.sort_values(by="Cloud Computing", ascending = False) data = data.head(10) print(data)
Producción:
Interés histórico de la hora
El método get_historical_interest() devuelve los datos históricos, indexados y por hora de cuándo se buscó más la palabra clave especificada. También puede mencionar varios parámetros de período de tiempo para los que desea los datos históricos, como inicio_año, inicio_mes, inicio_día, inicio_hora, fin_año, fin_mes, fin_día y fin_hora.
Python3
kw_list = ["Cloud Computing"] Trending_topics.build_payload(kw_list) data = Trending_topics.get_historical_interest( kw_list, year_start=2018, month_start=1, day_start=1, hour_start=0, year_end=2018, month_end=2, day_end=1, hour_end=0, cat=0, geo='', gprop='', sleep=0) data = data.sort_values(by="Cloud Computing", ascending = False) data = data.head(10) print(data)
Producción:
Interés por región
El siguiente es el método interest_by_region , que le permitirá conocer el rendimiento de la palabra clave por región. Mostrará resultados en una escala de 0 a 100, donde 100 indica el país con más búsquedas y 0 indica con menos búsquedas o datos insuficientes.
Python3
data = Trending_topics.interest_by_region() data = data.sort_values(by="Cloud Computing", ascending = False) data = data.head(10) print(data)
Después, al ejecutar el código anterior, obtendrá un resultado similar al siguiente, según el período de tiempo mencionado en el método build_payload.
Producción:
A continuación, podemos visualizar los datos anteriores usando un gráfico de barras.
Python3
data.reset_index().plot(x='geoName', y='Cloud Computing', figsize=(10,5), kind="bar") plt.style.use('fivethirtyeight') plt.show()
Producción:
Mejores gráficos
Usando este método, podemos obtener las principales búsquedas de tendencias anualmente. Entonces, veamos cuáles fueron las tendencias de búsqueda en el año 2020.
Python3
df = Trending_topics.top_charts(2020, hl='en-US', tz=300, geo='GLOBAL') df.head(10)
Producción:
Del resultado anterior, podemos ver que el tema más buscado de 2020 es » Coronavirus » y luego el resto.
Consultas relacionadas
Cada vez que un usuario busca algo sobre un tema en particular en Google, existe una alta probabilidad de que el usuario busque más consultas relacionadas con el mismo tema. Estas se conocen como consultas relacionadas. Encontremos una lista de consultas relacionadas con «Cloud Computing».
Python3
Trending_topics.build_payload(kw_list=['Cloud Computing']) related_queries = Trending_topics.related_queries() related_queries.values()
A continuación se presentan algunas de las consultas más buscadas en Google relacionadas con la computación en la nube.
Producción:
Sugerencias de palabras clave
El método de sugerencias() te ayudará a explorar lo que el mundo está buscando. Devuelve una lista de palabras clave sugeridas adicionales que se pueden usar para filtrar una búsqueda de tendencia en Google.
Python3
keywords = Trending_topics.suggestions( keyword='Cloud Computing') df = pd.DataFrame(keywords) df.drop(columns= 'mid')
Producción:
Publicación traducida automáticamente
Artículo escrito por samruddhi_kulkarni y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA