Cómo realizar una prueba de Anderson-Darling en Python

Prueba de Anderson-Darling: Su nombre completo es Anderson-Darling Goodness of Fit Test (AD-Test) y se utiliza para medir en qué medida nuestros datos se ajustan a la distribución especificada. En su mayoría, esta prueba se usa para encontrar si los datos siguen una distribución normal. 

Sintaxis para instalar la biblioteca scipy y numpy:

pip3 install scipy numpy

Scipy es una biblioteca de Python utilizada para el cálculo científico. Proporciona la función anderson() para realizar la prueba de Anderson-Darling. 

función de anderson():

Sintaxis:

anderson(arr, dist=’norma’)

Parámetros:

arr: es una array de datos de muestra

dist: Especifica el tipo de distribución contra la que se va a realizar la prueba. De forma predeterminada, está configurado en ‘norma’, pero también podemos usar ‘expon’ o ‘logistic’.

Ejemplo 1:

Python3

# Python program to conduct Anderson-Darling Test
  
# Importing libraries
import numpy as np
from scipy.stats import anderson
  
# Creating data
np.random.seed(0)
data = np.random.normal(size=100)
  
# Conduct Anderson-Darling Test 
anderson(data)

Producción:

Producción

El estadístico de prueba resulta ser 0,18. Este valor se puede comparar con cada valor crítico que corresponde a cada nivel de significación para verificar si los resultados de la prueba son significativos. 

Por ejemplo:

  • El valor crítico para α = 0,01 es igual a 1,021. Debido a que esta estadística de prueba (0,18) no es mayor que este valor crítico, no se puede decir que el resultado de la prueba sea significativo a un nivel de significación de 0,01.
  • El valor crítico para α = 0,025 es igual a 0,858. Debido a que esta estadística de prueba (0,18) no es mayor que este valor crítico, no se puede decir que el resultado de la prueba sea significativo a un nivel de significación de 0,025.

Dado que los resultados de la prueba no son significativos en ningún nivel de significancia, eso implica que no podemos rechazar la hipótesis nula de esta prueba. Por lo tanto, no tenemos pruebas suficientes para afirmar que los datos proporcionados no se distribuyen normalmente.

Ejemplo 2:

Ahora consideremos realizar la prueba de Anderson-Darling en una muestra de 100 números enteros aleatorios entre 0 y 20.

Python3

# Python program to conduct Anderson-Darling Test
  
# Importing libraries
import numpy as np
from scipy.stats import anderson
  
# Creating data
np.random.seed(0)
data = np.random.randint(0, 20, size=100)
  
# Conduct Anderson-Darling Test
anderson(data)

Producción:

Producción

La estadística de prueba resulta ser 2.073. Este valor se puede comparar con cada valor crítico que corresponde a cada nivel de significación para verificar si los resultados de la prueba son significativos.

Por ejemplo:

  • El valor crítico para α = 0,01 es igual a 1,021. Debido a que esta estadística de prueba (0,18) no es mayor que este valor crítico, no se puede decir que el resultado de la prueba sea significativo a un nivel de significación de 0,01.
  • El valor crítico para α = 0,025 es igual a 0,858. Debido a que esta estadística de prueba (0,18) no es mayor que este valor crítico, no se puede decir que el resultado de la prueba sea significativo a un nivel de significación de 0,025.

Dado que los resultados de la prueba no son significativos en ningún nivel de significancia, eso implica que no podemos rechazar la hipótesis nula de esta prueba. Por lo tanto, no tenemos pruebas suficientes para afirmar que los datos proporcionados no se distribuyen normalmente.

Publicación traducida automáticamente

Artículo escrito por bhuwanesh y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *