Cómo realizar una prueba de Kruskal-Wallis en Python

La prueba de Kruskal-Wallis es una prueba no paramétrica y una alternativa a One-Way Anova. Por paramétrico queremos decir que no se supone que los datos provengan de una distribución particular. El objetivo principal de esta prueba es determinar si existe una diferencia estadística entre las medianas de al menos tres grupos independientes. 

Hipótesis:

La prueba de Kruskal-Wallis tiene las hipótesis nula y alternativa como se analiza a continuación:

  • La hipótesis nula (H0): La mediana es la misma para todos los grupos de datos.
  • La hipótesis alternativa: (Ha): La mediana no es igual para todos los grupos de datos.

Implementación paso a paso:

Consideremos un ejemplo en el que el equipo de Investigación y Desarrollo quiere determinar si la aplicación de tres aceites de motor diferentes genera una diferencia en el kilometraje de los automóviles. El equipo decidió optar por 15 autos de la misma marca y dividirlos en grupos de tres (5 autos en cada grupo). Ahora cada grupo está dopado con exactamente un aceite de motor (se utilizan los tres aceites de motor). Luego se les dejaba correr 20 kilómetros por la misma pista y una vez terminado el recorrido se anotaba el kilometraje.

Paso 1: Crear los datos

El primer paso es crear datos. Necesitamos crear tres arrays que puedan contener el kilometraje de los automóviles (uno para cada grupo).

Python3

data_group1 = [7, 9, 12, 15, 21]
data_group2 = [5, 8, 14, 13, 25]
data_group3 = [6, 8, 8, 9, 5]

Paso 2: Realice la prueba de Kruskal-Wallis

Python nos proporciona la función kruskal() de la biblioteca scipy.stats con la que podemos realizar fácilmente la prueba Kruskal-Wallis en Python.

Python3

# Import libraries
from scipy import stats
  
# Defining data groups
data_group1 = [7, 9, 12, 15, 21]
data_group2 = [5, 8, 14, 13, 25]
data_group3 = [6, 8, 8, 9, 5]
  
# Conduct the Kruskal-Wallis Test 
result = stats.kruskal(data_group1, data_group2, data_group3)
  
# Print the result
print(result)

Producción:

 

Paso 3: Analizar los resultados.

En este ejemplo, el estadístico de prueba resulta ser igual a 3,492 y el valor p correspondiente es 0,174. Como el valor p no es inferior a 0,05, no podemos rechazar la hipótesis nula de que el kilometraje medio de los automóviles es el mismo para los tres grupos. Por lo tanto, no tenemos pruebas suficientes para afirmar que los diferentes tipos de aceites de motor solían generar diferencias estadísticamente significativas en el kilometraje de los automóviles.

Publicación traducida automáticamente

Artículo escrito por bhuwanesh y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *