En este artículo, cómo calcular cuantiles por grupo en Pandas usando Python.
Hay muchos métodos para calcular el cuantil, pero pandas proporciona la función groupby.quantile() para encontrarlo en unas pocas líneas de código. Este es el Método a usar cuando el cuantil deseado cae entre dos puntos.
Sintaxis:
DataFrameGroupBy.quantile(self, q=0.5, interpolación=’lineal’)
Parámetros:
- q : flotante o similar a una array, por defecto 0.5 (50% cuantil) Los valores se dan entre 0 y 1 proporcionando los cuantiles para calcular.
- Interpolación : {‘lineal’, ‘inferior’, ‘superior’, ‘punto medio’, ‘más cercano’}
En este método, los valores y la interpolación se pasan como parámetros. Por defecto, el valor de q será 0,5 y la interpolación será Lineal. Esto devuelve la serie o Dataframe determinado por el objeto GroupBy.
Trama de datos en uso:
Ejemplo 1: Calcular cuantiles por grupo
Python3
# Importing libraries import pandas as pd # Storing data in dictionary game = {'Player': ['A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C', 'C', 'C', 'C'], 'wins': [2, 4, 4, 5, 6, 9, 13, 13, 15, 15, 14, 13, 11, 9, 9, 8, 8, 16, 19, 21, 14, 20, 19, 18] } # Creating data frame df = pd.DataFrame(game) # calculating quantile df.groupby('Player').quantile(0.5)
Producción:
Ejemplo 2: Calcular cuantiles por grupo
Python3
# Importing libraries import pandas as pd # Storing data in dictionary game = {'Player': ['A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C', 'C', 'C', 'C'], 'wins': [2, 4, 4, 5, 6, 9, 13, 13, 15, 15, 14, 13, 11, 9, 9, 8, 8, 16, 19, 21, 14, 20, 19, 18] } # Creating data frame df = pd.DataFrame(game) # calculating quantile df.groupby('Player').quantile(0.9)
Producción:
Publicación traducida automáticamente
Artículo escrito por shivapriya1726 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA