Prueba t de Welch: la prueba t de dos muestras se utiliza para comparar las medias de dos conjuntos de datos independientes diferentes. Pero podemos aplicar una prueba T de dos muestras en aquellos grupos de datos que comparten la misma varianza. Ahora, para comparar dos grupos de datos que tienen diferentes varianzas, usamos la prueba t de Welch. Se considera el equivalente paramétrico de la prueba T de dos muestras.
El usuario debe instalar e importar las siguientes bibliotecas para realizar la prueba t de Welch en Python:
- espía
- entumecido
Sintaxis para instalar todos los paquetes anteriores:
pip3 install scipy numpy
La realización de la prueba t de Welch es un proceso paso a paso y se describen a continuación,
Paso 1: importa la biblioteca.
El primer paso es importar las bibliotecas instaladas anteriormente.
Python3
# Importing libraries import scipy.stats as stats import numpy as np
Paso 2: Crear grupos de datos.
Consideremos un ejemplo, se nos dan datos de dos muestras, cada una de las cuales contiene alturas de 10 estudiantes de una clase. Necesitamos verificar si dos estudiantes de diferentes clases tienen la misma altura media. Podemos crear grupos de datos usando el método numpy.array().
Python3
# Creating data groups data_group1 = np.array([14, 15, 15, 16, 13, 8, 14, 17, 16, 14, 19, 20, 21, 15, 15]) data_group2 = np.array([36, 37, 44, 27, 24, 28, 27, 39, 29, 24, 37, 32, 24, 26, 33])
Paso 3: Verifique la variación.
Antes de realizar la prueba t de Welch, debemos averiguar si los grupos de datos dados tienen la misma varianza. Si la relación entre los grupos de datos más grandes y los grupos de datos pequeños es mayor que 4:1, entonces podemos considerar que los grupos de datos dados tienen una varianza desigual. Para encontrar la varianza de un grupo de datos, podemos usar la siguiente sintaxis,
Sintaxis:
imprimir (np.var (grupo_datos))
Aquí,
data_group: El grupo de datos dado
Python3
# Python program to display variance # of data groups # Import library import scipy.stats as stats import numpy as np # Creating data groups data_group1 = np.array([14, 15, 15, 16, 13, 8, 14, 17, 16, 14, 19, 20, 21, 15, 15]) data_group2 = np.array([36, 37, 44, 27, 24, 28, 27, 39, 29, 24, 37, 32, 24, 26, 33]) # Print the variance of both data groups print(np.var(data_group1), np.var(data_group2))
Producción:
Aquí, la relación es mayor que 4: 1, por lo que la varianza es diferente. Entonces, podemos aplicar la prueba t de Welch.
Paso 4: Realización de la prueba t de Welch.
Sintaxis:
ttest_ind(data_group1, data_group2, equal_var= False)
Aquí,
data_group1: primer grupo de datos
data_group2: segundo grupo de datos
equal_var = “False”: La prueba t de Welch se realizará sin tener en cuenta las varianzas poblacionales iguales.
Ejemplo:
Python3
# Python program to conduct Welch's t-Test # Import library import scipy.stats as stats import numpy as np # Creating data groups data_group1 = np.array([14, 15, 15, 16, 13, 8, 14, 17, 16, 14, 19, 20, 21, 15, 15]) data_group2 = np.array([36, 37, 44, 27, 24, 28, 27, 39, 29, 24, 37, 32, 24, 26, 33]) # Conduct Welch's t-Test and print the result print(stats.ttest_ind(data_group1, data_group2, equal_var = False))
Producción:
Interpretación de la Salida:
El estadístico de prueba resulta ser -8,658 y el valor p correspondiente es 2,757e-08. Aquí el valor p es inferior a 0,05, por lo que podríamos rechazar la hipótesis nula de la prueba y concluir que la diferencia entre la puntuación media del examen de ambos tipos de estudiantes es bastante significativa.