¿Cómo combinar Groupby y múltiples funciones agregadas en Pandas?

Pandas es un paquete de Python que ofrece varias estructuras de datos y operaciones para manipular datos numéricos y series temporales. Es principalmente popular para importar y analizar datos mucho más fácilmente. Es una biblioteca de código abierto que se basa en la biblioteca NumPy.

Agrupar por()

La función Pandas dataframe.groupby()se usa para dividir los datos en el marco de datos en grupos según una condición dada.

Ejemplo 1:

# import library
import pandas as pd
  
# import csv file
df = pd.read_csv("https://bit.ly/drinksbycountry")
  
df.head()

Producción:

Ejemplo 2:

# Find the average of each continent
# by grouping the data  
# based on the "continent".
df.groupby(["continent"]).mean()

Producción:

Agregar()

La función Pandas dataframe.agg()se utiliza para realizar una o más operaciones en datos basados ​​en un eje específico

Ejemplo:

# here sum, minimum and maximum of column 
# beer_servings is calculatad
df.beer_servings.agg(["sum", "min", "max"])

Producción:

Usando estas dos funciones juntas: podemos encontrar múltiples funciones de agregación de una columna en particular agrupadas por otra columna.

Ejemplo:

# find an aggregation of column "beer_servings"
# by grouping the "continent" column.
df.groupby(df["continent"]).beer_servings.agg(["min",
                                               "max",
                                               "sum",
                                               "count",
                                               "mean"])

Producción:

Publicación traducida automáticamente

Artículo escrito por deepak_k y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *