Prueba de Anderson-Darling: Su nombre completo es Anderson-Darling Goodness of Fit Test (AD-Test) y se utiliza para medir en qué medida nuestros datos se ajustan a la distribución especificada. En su mayoría, esta prueba se usa para encontrar si los datos siguen una distribución normal.
Sintaxis para instalar la biblioteca scipy y numpy:
pip3 install scipy numpy
Scipy es una biblioteca de Python utilizada para el cálculo científico. Proporciona la función anderson() para realizar la prueba de Anderson-Darling.
función de anderson():
Sintaxis:
anderson(arr, dist=’norma’)
Parámetros:
arr: es una array de datos de muestra
dist: Especifica el tipo de distribución contra la que se va a realizar la prueba. De forma predeterminada, está configurado en ‘norma’, pero también podemos usar ‘expon’ o ‘logistic’.
Ejemplo 1:
Python3
# Python program to conduct Anderson-Darling Test # Importing libraries import numpy as np from scipy.stats import anderson # Creating data np.random.seed(0) data = np.random.normal(size=100) # Conduct Anderson-Darling Test anderson(data)
Producción:
El estadístico de prueba resulta ser 0,18. Este valor se puede comparar con cada valor crítico que corresponde a cada nivel de significación para verificar si los resultados de la prueba son significativos.
Por ejemplo:
- El valor crítico para α = 0,01 es igual a 1,021. Debido a que esta estadística de prueba (0,18) no es mayor que este valor crítico, no se puede decir que el resultado de la prueba sea significativo a un nivel de significación de 0,01.
- El valor crítico para α = 0,025 es igual a 0,858. Debido a que esta estadística de prueba (0,18) no es mayor que este valor crítico, no se puede decir que el resultado de la prueba sea significativo a un nivel de significación de 0,025.
Dado que los resultados de la prueba no son significativos en ningún nivel de significancia, eso implica que no podemos rechazar la hipótesis nula de esta prueba. Por lo tanto, no tenemos pruebas suficientes para afirmar que los datos proporcionados no se distribuyen normalmente.
Ejemplo 2:
Ahora consideremos realizar la prueba de Anderson-Darling en una muestra de 100 números enteros aleatorios entre 0 y 20.
Python3
# Python program to conduct Anderson-Darling Test # Importing libraries import numpy as np from scipy.stats import anderson # Creating data np.random.seed(0) data = np.random.randint(0, 20, size=100) # Conduct Anderson-Darling Test anderson(data)
Producción:
La estadística de prueba resulta ser 2.073. Este valor se puede comparar con cada valor crítico que corresponde a cada nivel de significación para verificar si los resultados de la prueba son significativos.
Por ejemplo:
- El valor crítico para α = 0,01 es igual a 1,021. Debido a que esta estadística de prueba (0,18) no es mayor que este valor crítico, no se puede decir que el resultado de la prueba sea significativo a un nivel de significación de 0,01.
- El valor crítico para α = 0,025 es igual a 0,858. Debido a que esta estadística de prueba (0,18) no es mayor que este valor crítico, no se puede decir que el resultado de la prueba sea significativo a un nivel de significación de 0,025.
Dado que los resultados de la prueba no son significativos en ningún nivel de significancia, eso implica que no podemos rechazar la hipótesis nula de esta prueba. Por lo tanto, no tenemos pruebas suficientes para afirmar que los datos proporcionados no se distribuyen normalmente.