¿Cómo calcular percentiles en R?

En este artículo, discutiremos cómo calcular percentiles en el lenguaje de programación R. 

Los percentiles son medidas de tendencia central, que representan que, de los datos totales, ciertos datos porcentuales se encuentran debajo de ellos. En R, podemos usar la función quantile() para hacer el trabajo.

Sintaxis: cuantil (datos, problemas)

Parámetro: 

  • datos: datos cuyos percentiles se quieren calcular
  • probs: valor percentil

Ejemplo 1: Calcular percentil

Para calcular el percentil simplemente pasamos los datos y el valor del percentil requerido.

R

x<-c(2,13,5,36,12,50)
  
res<-quantile(x,probs=0.5)
  
res

Producción:

 50%  
12.5

Ejemplo 2: Calcular percentiles de vector

Podemos calcular múltiples percentiles a la vez. Para eso, tenemos que pasar el vector de percentiles en lugar de un solo valor al parámetro probs.

R

x<-c(2,13,5,36,12,50)
  
res<-quantile(x,probs=c(0.5,0.75))
  
res

Producción:

 50%   75%  
12.50 30.25 

Ejemplo 4: calcular el percentil en el marco de datos

A veces, el requisito solicita calcular los percentiles para una columna de marco de datos, en ese caso, todo el proceso sigue siendo el mismo, solo que debe pasar el nombre de la columna en lugar de los datos junto con el valor del percentil que se calculará.

R

df<-data.frame(x=c(2,13,5,36,12,50),
y=c('a','b','c','c','c','b'))
  
res<-quantile(df$x,probs=c(0.35,0.7))
  
res

Producción:

 35%   70%  
10.25 24.50 

Ejemplo 5: Cuantiles de varias y todas las columnas

También podemos encontrar percentiles de varias columnas de marcos de datos a la vez. Esto también se puede aplicar para encontrar los percentiles de todas las columnas numéricas del marco de datos. Para esto, usamos la función apply(), dentro de esto pasaremos el marco de datos con solo columnas numéricas y la función cuantil que debe aplicarse en todas las columnas.

Sintaxis: apply (marco de datos, función)

R

df<-data.frame(x=c(2,13,5,36,12,50),
y=c('a','b','c','c','c','b'),
z=c(2.1,6,3.8,4.8,2.2,1.1))
  
sub_df<-df[,c('x','z')]
  
res<-apply(sub_df, 2, function(x) quantile(x,probs=0.5))
  
res

Producción:

   x    z  
12.5  3.0 

Ejemplo 6: Calcular cuantiles por grupo

También podemos agrupar valores y encontrar el percentil con respecto a cada grupo. Para esto, usamos la función groupby(), y luego dentro de summary() aplicaremos la función quantile.

R

library(dplyr)
  
df<-data.frame(x=c(2,13,5,36,12,50),
  
              y=c('a','b','c','c','c','b'))
  
df %>% group_by(y) %>%
  
 summarize(res=quantile(x,probs=0.5))

Producción:

A tibble: 3 x 2
y       res
<chr> <dbl>
a       2  
b      31.5
c      12 

Ejemplo 7: visualización de percentiles

Visualizar los percentiles puede mejorar la comprensión. 

R

df<-data.frame(x=c(2,13,5,36,12,50),
y=c('a','b','c','c','c','b'),
z=c(2.1,6,3.8,4.8,2.2,1.1))
  
n<-length(df$x)
  
plot((1:n-1)/(n-1), sort(df$x.Length), type='h',
     xlab = "Percentile",
  ylab = "Value")

Producción:

Publicación traducida automáticamente

Artículo escrito por vanshikagoyal43 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *