¿Cómo calcular la asimetría y la curtosis en Python?

La asimetría es un término estadístico y es una forma de estimar o medir la forma de una distribución. Es una metodología estadística importante que se utiliza para estimar el comportamiento asimétrico en lugar de calcular la distribución de frecuencias. La asimetría puede ser de dos tipos:

  • Simétrica: una distribución puede llamarse simétrica si parece igual desde la izquierda y la derecha desde el punto central.
  • Asimétrica: una distribución puede llamarse asimétrica si no parece igual desde la izquierda y la derecha desde el punto central.

Distribución sobre la base del valor de asimetría:

  • Asimetría = 0: Entonces normalmente distribuida.
  • Asimetría > 0: Entonces más peso en la cola izquierda de la distribución.
  • Asimetría < 0: Entonces más peso en la cola derecha de la distribución.

Curtosis:

También es un término estadístico y una característica importante de la distribución de frecuencias. Determina si una distribución tiene colas pesadas con respecto a la distribución normal. Proporciona información sobre la forma de una distribución de frecuencias.

  • la curtosis para la distribución normal es igual a 3.
  • Para una distribución con curtosis < 3: Se llama playkurtic.
  • Para una distribución que tiene una curtosis > 3, se llama leptocúrtica y significa que trata de producir más valores atípicos en lugar de la distribución normal.

Este artículo se centra en cómo calcular la asimetría y la curtosis en Python.

¿Cómo calcular la asimetría y la curtosis en Python?

Calcular la asimetría y la curtosis es un proceso paso a paso. Los pasos se discuten a continuación.

Paso 1: Importación de la biblioteca SciPy.

SciPy es una biblioteca científica de código abierto. Proporciona funciones integradas para calcular la asimetría y la curtosis. Podemos importar esta biblioteca usando el siguiente código.

Python3

# Importing scipy
import scipy

Paso 2: Crear un conjunto de datos.

Antes de calcular la asimetría y la curtosis, necesitamos crear un conjunto de datos.

Python3

# Creating a dataset
dataset = [10, 25, 14, 26, 35, 45, 67, 90, 
           40, 50, 60, 10, 16, 18, 20]

Paso 3: cálculo de la asimetría del conjunto de datos.

Podemos calcular la asimetría del conjunto de datos utilizando la función skew() incorporada. Su sintaxis se da a continuación,

Sintaxis:

scipy.stats.skew(array, eje=0, sesgo=Verdadero)

Parámetros:

  • array: representa la array de entrada (u objeto) que contiene elementos.
  • eje: Significa el eje a lo largo del cual queremos encontrar el valor de asimetría (Por defecto eje = 0).
  • bias = False: los cálculos se corrigen al sesgo estadístico.

Tipo de devolución:

Valor de asimetría del conjunto de datos, a lo largo del eje.

Ejemplo:

Python3

# Importing library
from scipy.stats import skew
  
# Creating a dataset
dataset = [88, 85, 82, 97, 67, 77, 74, 86, 
           81, 95, 77, 88, 85, 76, 81]
  
# Calculate the skewness
print(skew(dataset, axis=0, bias=True))

Producción:

asimetría del conjunto de datos

Significa que la distribución está sesgada positivamente.

Paso 4: Cálculo de la curtosis del conjunto de datos.

Podemos calcular la curtosis del conjunto de datos usando la función incorporada kurtosis(). Su sintaxis se da a continuación,

Sintaxis:

scipy.stats.kurtosis(array, eje=0, pescador=Verdadero, sesgo=Verdadero)

Parámetros:

  • array: Array de entrada u objeto que tiene los elementos.
  • eje: Representa el eje a lo largo del cual se va a medir el valor de la curtosis. Por defecto eje = 0.
  • fisher = True: Se utilizará la definición de fisher (normal 0.0).
  • fisher = False: Se utilizará la definición de Pearson (normal 3.0).
  • Sesgo = Verdadero: los cálculos se corrigen por sesgo estadístico, si se establece en Falso.

Tipo de devolución:

Valor de curtosis de la distribución normal para el conjunto de datos.

Ejemplo:

Python3

# Importing library
  
from scipy.stats import kurtosis
  
# Creating a dataset
dataset = [88, 85, 82, 97, 67, 77, 74, 86,
           81, 95, 77, 88, 85, 76, 81]
  
  
# Calculate the kurtosis
print(kurtosis(dataset, axis=0, bias=True))

Producción:

curtosis del conjunto de datos

Significa que la distribución tiene más valores en las colas en comparación con una distribución normal.

Publicación traducida automáticamente

Artículo escrito por bhuwanesh y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *