La prueba de Kruskal-Wallis es una prueba no paramétrica y una alternativa a One-Way Anova. Por paramétrico queremos decir que no se supone que los datos provengan de una distribución particular. El objetivo principal de esta prueba es determinar si existe una diferencia estadística entre las medianas de al menos tres grupos independientes.
Hipótesis:
La prueba de Kruskal-Wallis tiene las hipótesis nula y alternativa como se analiza a continuación:
- La hipótesis nula (H0): La mediana es la misma para todos los grupos de datos.
- La hipótesis alternativa: (Ha): La mediana no es igual para todos los grupos de datos.
Implementación paso a paso:
Consideremos un ejemplo en el que el equipo de Investigación y Desarrollo quiere determinar si la aplicación de tres aceites de motor diferentes genera una diferencia en el kilometraje de los automóviles. El equipo decidió optar por 15 autos de la misma marca y dividirlos en grupos de tres (5 autos en cada grupo). Ahora cada grupo está dopado con exactamente un aceite de motor (se utilizan los tres aceites de motor). Luego se les dejaba correr 20 kilómetros por la misma pista y una vez terminado el recorrido se anotaba el kilometraje.
Paso 1: Crear los datos
El primer paso es crear datos. Necesitamos crear tres arrays que puedan contener el kilometraje de los automóviles (uno para cada grupo).
Python3
data_group1 = [7, 9, 12, 15, 21] data_group2 = [5, 8, 14, 13, 25] data_group3 = [6, 8, 8, 9, 5]
Paso 2: Realice la prueba de Kruskal-Wallis
Python nos proporciona la función kruskal() de la biblioteca scipy.stats con la que podemos realizar fácilmente la prueba Kruskal-Wallis en Python.
Python3
# Import libraries from scipy import stats # Defining data groups data_group1 = [7, 9, 12, 15, 21] data_group2 = [5, 8, 14, 13, 25] data_group3 = [6, 8, 8, 9, 5] # Conduct the Kruskal-Wallis Test result = stats.kruskal(data_group1, data_group2, data_group3) # Print the result print(result)
Producción:
Paso 3: Analizar los resultados.
En este ejemplo, el estadístico de prueba resulta ser igual a 3,492 y el valor p correspondiente es 0,174. Como el valor p no es inferior a 0,05, no podemos rechazar la hipótesis nula de que el kilometraje medio de los automóviles es el mismo para los tres grupos. Por lo tanto, no tenemos pruebas suficientes para afirmar que los diferentes tipos de aceites de motor solían generar diferencias estadísticamente significativas en el kilometraje de los automóviles.