En este artículo, discutiremos cómo calcular percentiles en el lenguaje de programación R.
Los percentiles son medidas de tendencia central, que representan que, de los datos totales, ciertos datos porcentuales se encuentran debajo de ellos. En R, podemos usar la función quantile() para hacer el trabajo.
Sintaxis: cuantil (datos, problemas)
Parámetro:
- datos: datos cuyos percentiles se quieren calcular
- probs: valor percentil
Ejemplo 1: Calcular percentil
Para calcular el percentil simplemente pasamos los datos y el valor del percentil requerido.
R
x<-c(2,13,5,36,12,50) res<-quantile(x,probs=0.5) res
Producción:
50% 12.5
Ejemplo 2: Calcular percentiles de vector
Podemos calcular múltiples percentiles a la vez. Para eso, tenemos que pasar el vector de percentiles en lugar de un solo valor al parámetro probs.
R
x<-c(2,13,5,36,12,50) res<-quantile(x,probs=c(0.5,0.75)) res
Producción:
50% 75% 12.50 30.25
Ejemplo 4: calcular el percentil en el marco de datos
A veces, el requisito solicita calcular los percentiles para una columna de marco de datos, en ese caso, todo el proceso sigue siendo el mismo, solo que debe pasar el nombre de la columna en lugar de los datos junto con el valor del percentil que se calculará.
R
df<-data.frame(x=c(2,13,5,36,12,50), y=c('a','b','c','c','c','b')) res<-quantile(df$x,probs=c(0.35,0.7)) res
Producción:
35% 70% 10.25 24.50
Ejemplo 5: Cuantiles de varias y todas las columnas
También podemos encontrar percentiles de varias columnas de marcos de datos a la vez. Esto también se puede aplicar para encontrar los percentiles de todas las columnas numéricas del marco de datos. Para esto, usamos la función apply(), dentro de esto pasaremos el marco de datos con solo columnas numéricas y la función cuantil que debe aplicarse en todas las columnas.
Sintaxis: apply (marco de datos, función)
R
df<-data.frame(x=c(2,13,5,36,12,50), y=c('a','b','c','c','c','b'), z=c(2.1,6,3.8,4.8,2.2,1.1)) sub_df<-df[,c('x','z')] res<-apply(sub_df, 2, function(x) quantile(x,probs=0.5)) res
Producción:
x z 12.5 3.0
Ejemplo 6: Calcular cuantiles por grupo
También podemos agrupar valores y encontrar el percentil con respecto a cada grupo. Para esto, usamos la función groupby(), y luego dentro de summary() aplicaremos la función quantile.
R
library(dplyr) df<-data.frame(x=c(2,13,5,36,12,50), y=c('a','b','c','c','c','b')) df %>% group_by(y) %>% summarize(res=quantile(x,probs=0.5))
Producción:
A tibble: 3 x 2 y res <chr> <dbl> a 2 b 31.5 c 12
Ejemplo 7: visualización de percentiles
Visualizar los percentiles puede mejorar la comprensión.
R
df<-data.frame(x=c(2,13,5,36,12,50), y=c('a','b','c','c','c','b'), z=c(2.1,6,3.8,4.8,2.2,1.1)) n<-length(df$x) plot((1:n-1)/(n-1), sort(df$x.Length), type='h', xlab = "Percentile", ylab = "Value")
Producción:
Publicación traducida automáticamente
Artículo escrito por vanshikagoyal43 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA