variables aleatorias varianza homocedástica homogeneidad de la varianza , expliquemos los métodos para verificar la prueba de homogeneidad de las varianzas en la programación R en dos o más grupos. Algunas pruebas estadísticas, como la prueba T de dos muestras independientes y la prueba ANOVA , suponen que las varianzas son iguales entre los grupos. Hay varias pruebas de varianza que se pueden utilizar para evaluar la igualdad de varianzas. Éstos incluyen:
- compara las varianzas de dos grupos. Los datos deben estar normalmente distribuidos en esta prueba.
- Prueba de Bartlett: Compara las varianzas de dos o más grupos. Los datos también deben estar distribuidos normalmente en esta prueba.
- Prueba de Levene: una alternativa robusta a la prueba de Bartlett que es menos sensible a las desviaciones de la normalidad.
- Prueba de Fligner-Killeen: una prueba no paramétrica que es muy robusta frente a las desviaciones de la normalidad.
Preparación del conjunto de datos
Antes de explicar cada prueba, primero preparemos y entendamos el conjunto de datos. Considere que uno de los conjuntos de datos de aprendizaje estándar incluidos en R es el conjunto de datos » Gente de crecimiento «. El conjunto de datos de crecimiento dental es la longitud de los dientes en cada uno de los 10 conejillos de indias en tres niveles de dosis de vitamina C (0,5, 1 y 2 mg) con dos métodos de administración (jugo de naranja o ácido ascórbico). El archivo contiene 60 observaciones de 3 variables
- len: longitud del diente
- sup: tipo de suplemento (VC o DO)
- dosis: Dosis en miligramos
R
# Exploring the ToothGrowth data set print(head(ToothGrowth, 10)) print(str(ToothGrowth))
Producción:
len supp dose 1 4.2 VC 0.5 2 11.5 VC 0.5 3 7.3 VC 0.5 4 5.8 VC 0.5 5 6.4 VC 0.5 6 10.0 VC 0.5 7 11.2 VC 0.5 8 11.2 VC 0.5 9 5.2 VC 0.5 10 7.0 VC 0.5 'data.frame': 60 obs. of 3 variables: $ len : num 4.2 11.5 7.3 5.8 6.4 10 11.2 11.2 5.2 7 ... $ supp: Factor w/ 2 levels "OJ","VC": 2 2 2 2 2 2 2 2 2 2 ... $ dose: num 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 ... NULL
prueba F
se utiliza para comparar las varianzas de los dos grupos. La prueba F se utiliza para evaluar si las varianzas de dos poblaciones son iguales o no. Los datos deben estar normalmente distribuidos en esta prueba.
Hipótesis estadística:
Una hipótesis es una declaración estadística para comprender la prueba de hipótesis. Para la prueba F, las hipótesis estadísticas son:
- Hipótesis Nula: Las varianzas de los dos grupos son iguales
- Hipótesis alternativa: Las varianzas son diferentes
Implementación en R:
Con la ayuda del método var.test() , se puede realizar la prueba f entre dos poblaciones normales con alguna hipótesis de que las varianzas de dos poblaciones son iguales en la programación R.
var.test(fórmula, conjunto de datos)
Parámetros:
fórmula: una fórmula de la forma valores ~ grupos
conjunto de datos: una array o marco de datos
Ejemplo:
R
# R program to illustrate # F-test # Using var.test() result = var.test(len ~ supp, data = ToothGrowth) # print the result print(result)
Producción:
F test to compare two variances data: len by supp F = 0.6386, num df = 29, denom df = 29, p-value = 0.2331 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.3039488 1.3416857 sample estimates: ratio of variances 0.6385951
Interpretación:
El valor de p es p = 0,2, que es mayor que el nivel de significancia de 0,05. En conclusión, no existe una diferencia significativa entre las dos varianzas.
prueba de bartlett
Las varianzas de la prueba de Bartlett son homocedasticidad , lo que nos permite decidir el ajuste
Hipótesis estadística:
- Hipótesis nula: todas las varianzas de las poblaciones son iguales
- Hipótesis alternativa: Al menos dos de ellas difieren
Implementación en R:
bartlett.test(fórmula, conjunto de datos)
Parámetros:
fórmula: una fórmula de la forma valores ~ grupos
conjunto de datos: una array o marco de datos
Ejemplo:
R
# R program to illustrate # Barlett’s test # Using bartlett.test() result = bartlett.test(len ~ supp, data = ToothGrowth) # print the result print(result)
Producción:
Bartlett test of homogeneity of variances data: len by supp Bartlett's K-squared = 1.4217, df = 1, p-value = 0.2331
prueba de levene
La prueba de Levene evalúa las varianzas determinadasestándarencontrarvariasformadasexamina la hipótesis nula homogeneidad de la varianza homocedasticidad compara
Hipótesis estadística:
- Hipótesis nula: todas las varianzas de las poblaciones son iguales
- Hipótesis alternativa: Al menos dos de ellas difieren
Implementación en R:
que
leveneTest(fórmula, conjunto de datos)
Parámetros:
fórmula: una fórmula de la forma valores ~ grupos
conjunto de datos: una array o marco de datos
Ejemplo:
R
# R program to illustrate # Levene's test # Import required package library(car) # Using leveneTest() result = leveneTest(len ~ supp, data = ToothGrowth) # print the result print(result)
Producción:
Levene's Test for Homogeneity of Variance (center = median) Df F value Pr(>F) group 1 1.2136 0.2752 58
Prueba de Fligner-Killeen
Hipótesis estadística:
- Hipótesis nula: todas las varianzas de las poblaciones son iguales
- Hipótesis alternativa: Al menos dos de ellas difieren
Implementación en R:
que la prueba de Fligner-Killeen
fligner.test(fórmula, conjunto de datos)
Parámetros:
fórmula: una fórmula de la forma valores ~ grupos
conjunto de datos: una array o marco de datos
Ejemplo:
R
# R program to illustrate # Fligner-Killeen test # Import required package library(stats) # Using fligner.test() result = fligner.test(len ~ supp, data = ToothGrowth) # print the result print(result)
Producción:
Fligner-Killeen test of homogeneity of variances data: len by supp Fligner-Killeen:med chi-squared = 0.97034, df = 1, p-value = 0.3246
Publicación traducida automáticamente
Artículo escrito por AmiyaRanjanRout y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA