En estadística, la asimetría y la curtosis son las medidas que informan sobre la forma de la distribución de datos o, simplemente, ambos son métodos numéricos para analizar la forma del conjunto de datos, a diferencia de los gráficos e histogramas, que son métodos gráficos. Son pruebas de normalidad para comprobar la irregularidad y asimetría de la distribución. Para calcular la asimetría y la curtosis en lenguaje R, se requiere el paquete de momentos .
Oblicuidad
La asimetría es un método numérico estadístico para medir la asimetría de la distribución o conjunto de datos. Informa sobre la posición de la mayoría de los valores de los datos en la distribución alrededor del valor medio.
Fórmula:
donde,
representa el coeficiente de asimetría
representa el valor en el vector de datos
representa la media del vector de datos
n representa el número total de observaciones
Existen 3 tipos de valores de asimetría sobre la base de los cuales se decide la asimetría del gráfico. Estos son los siguientes:
Sesgo positivo
Si el coeficiente de asimetría es mayor que 0, es decir , se dice que el gráfico tiene una asimetría positiva con la mayoría de los valores de los datos inferiores a la media. La mayoría de los valores se concentran en el lado izquierdo del gráfico.
Ejemplo:
Python3
# Required for skewness() function library(moments) # Defining data vector x <- c(40, 41, 42, 43, 50) # output to be present as PNG file png(file = "positiveskew.png") # Print skewness of distribution print(skewness(x)) # Histogram of distribution hist(x) # Saving the file dev.off()
Producción:
[1] 1.2099
Representación grafica:
Asimetría cero o simétrica
Si el coeficiente de asimetría es igual a 0 o aproximadamente cercano a 0, es decir , se dice que el gráfico es simétrico y que los datos se distribuyen normalmente.
Ejemplo:
Python3
# Required for skewness() function library(moments) # Defining normally distributed data vector x <- rnorm(50, 10, 10) # output to be present as PNG file png(file = "zeroskewness.png") # Print skewness of distribution print(skewness(x)) # Histogram of distribution hist(x) # Saving the file dev.off()
Producción:
[1] -0.02991511
Representación grafica:
sesgado negativamente
Si el coeficiente de asimetría es menor que 0, es decir , entonces se dice que el gráfico tiene una asimetría negativa con la mayoría de los valores de los datos mayores que la media. La mayoría de los valores se concentran en el lado derecho del gráfico.
Ejemplo:
Python3
# Required for skewness() function library(moments) # Defining data vector x <- c(10, 11, 21, 22, 23, 25) # output to be present as PNG file png(file = "negativeskew.png") # Print skewness of distribution print(skewness(x)) # Histogram of distribution hist(x) # Saving the file dev.off()
Producción:
[1] -0.5794294
Representación grafica:
curtosis
La curtosis es un método numérico en estadística que mide la nitidez del pico en la distribución de datos.
Fórmula:
donde,
representa el coeficiente de curtosis
representa el valor en el vector de datos
representa la media del vector de datos
n representa el número total de observaciones
Existen 3 tipos de valores de curtosis sobre la base de los cuales se mide la nitidez del pico. Estos son los siguientes:
platicúrtico
Si el coeficiente de curtosis es inferior a 3, es decir , la distribución de datos es platicúrtica. Ser platykurtic no significa que el gráfico sea plano.
Ejemplo:
Python3
# Required for kurtosis() function library(moments) # Defining data vector x <- c(rep(61, each = 10), rep(64, each = 18), rep(65, each = 23), rep(67, each = 32), rep(70, each = 27), rep(73, each = 17)) # output to be present as PNG file png(file = "platykurtic.png") # Print skewness of distribution print(kurtosis(x)) # Histogram of distribution hist(x) # Saving the file dev.off()
Producción:
[1] 2.258318
Representación grafica:
mesocúrtico
Si el coeficiente de curtosis es igual a 3 o aproximadamente cercano a 3, es decir , entonces la distribución de datos es mesocúrtica. Para una distribución normal, el valor de la curtosis es aproximadamente igual a 3.
Ejemplo:
Python3
# Required for kurtosis() function library(moments) # Defining data vector x <- rnorm(100) # output to be present as PNG file png(file = "mesokurtic.png") # Print skewness of distribution print(kurtosis(x)) # Histogram of distribution hist(x) # Saving the file dev.off()
Producción:
[1] 2.963836
Representación grafica:
leptocúrtico
Si el coeficiente de curtosis es mayor que 3, es decir , la distribución de datos es leptocúrtica y muestra un pico pronunciado en el gráfico.
Ejemplo:
Python3
# Required for kurtosis() function library(moments) # Defining data vector x <- c(rep(61, each = 2), rep(64, each = 5), rep(65, each = 42), rep(67, each = 12), rep(70, each = 10)) # output to be present as PNG file png(file = "leptokurtic.png") # Print skewness of distribution print(kurtosis(x)) # Histogram of distribution hist(x) # Saving the file dev.off()
Producción:
[1] 3.696788
Representación grafica:
Publicación traducida automáticamente
Artículo escrito por utkarsh_kumar y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA