¿Cómo realizar la prueba de Bartlett en Python?

La prueba de Bartlett se utiliza para verificar si todas las muestras tienen la misma varianza. también se llama prueba de homogeneidad de Bartlett. Antes de ejecutar algunas pruebas estadísticas como el One-Way ANOVA, la prueba de Barlett asegura que la hipótesis de igualdad de varianzas es correcta. Se utiliza cuando es casi seguro que sus datos provienen de una distribución gaussiana o una distribución normal.

Hay una variación considerable en las varianzas si el estadístico de la prueba de Bartlett es mayor que este valor crítico. No hay diferencia significativa si el estadístico de la prueba de Bartlett es menor que este valor crítico.

Esta es una prueba de hipótesis y las dos hipótesis son las siguientes:

  • hipótesis nula : los grupos tienen igual varianza.
  • Hipótesis alternativa : un grupo tiene una varianza diferente en comparación con los demás.

Si ‘n’ es el número de grupos, n-1 es el grado de libertad. Si el valor p es menor que el nivel de significación (valor alfa) aceptamos la hipótesis alternativa y rechazamos la hipótesis nula. En python, la prueba de Bartlett se realiza utilizando la función scipy.stats.bartlett() de la biblioteca scipy.stats.

función scipy.stats.bartlett():

sintaxis : scipy.stats.bartlett(*args)

args: arreglos de muestras

Devoluciones

  • estadística – valor flotante
  • pvalue – valor p de la prueba

Ejemplo:

En este ejemplo, importamos los paquetes necesarios, leemos el archivo CSV. hay tres especies en el conjunto de datos y necesitamos la longitud del sépalo de cada especie para realizar la prueba de Bartlett para verificar si tienen las mismas varianzas y si provienen de poblaciones que tienen la misma varianza. el método devuelve test_statistic y p-value.

Para ver y descargar el archivo CSV utilizado, haga clic aquí .

Python3

# importing packages and modules
import pandas as pd
import scipy.stats as stats
  
# reading CSV file
dataset = pd.read_csv('iris.csv')
  
# data which contains sepal width of the three species
data = [dataset[dataset['species'] == "setosa"]['sepal_length'],
        dataset[dataset['species'] == "versicolor"]['sepal_length'],
        dataset[dataset['species'] == "virginica"]['sepal_length']]
  
# performing Bartlett's test
test_statistic, p_value = stats.bartlett(data[0], data[1], data[2])
  
print(test_statistic, p_value)

Producción:

16.005701874401502 0.0003345076070163035

Si consideramos que el nivel de significación del valor alfa es 0,05, podemos ver claramente que el valor p es inferior a 0,05. por lo tanto, se rechaza nuestra hipótesis nula y se toma una hipótesis alternativa. los grupos no tienen la misma varianza y pueden provenir de diferentes poblaciones. Una suposición de ANOVA unidireccional es que los grupos deben tener varianzas iguales, pero como se contradice en este ejemplo, podemos llegar a la conclusión de que no se debe realizar ANOVA unidireccional. 

Publicación traducida automáticamente

Artículo escrito por sarahjane3102 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *