La prueba de Dunn debe usarse para establecer qué grupos son distintos si la prueba de Kruskal-Wallis arroja resultados estadísticamente significativos. Después de que su ANOVA haya revelado una diferencia notable en tres o más medias, puede aplicar la Prueba de Dunn para determinar qué medias en particular son diferentes del resto. La prueba de comparación múltiple de Dunn es una prueba no paramétrica post hoc no paramétrica que no supone que sus datos provengan de una determinada distribución.
Para realizar la prueba de duns, el usuario necesita llamar a la función posthoc_dunn() desde la biblioteca scikit-posthocs.
función posthoc_dunn():
Sintaxis:
scikit_posthocs.posthoc_dunn(a, val_col: str = Ninguno, group_col: str = Ninguno, p_adjust: str = Ninguno, sort: bool = True)
Parámetros:
- a : es un objeto de tipo array o un objeto o serie de marco de datos.
- group_col : columna del predictor o de la variable dependiente
- p_adjust: los valores P se pueden ajustar usando este método. es un tipo de string los valores posibles son:
- ‘bonferroni’
- hommel
- holm-sidak
- encina
- simes-hochberg y más…
Devuelve: valores p.
Sintaxis para instalar la biblioteca posthocs:
pip instalar scikit-posthocs
Esta es una prueba de hipótesis y las dos hipótesis son las siguientes:
- Hipótesis nula: la muestra dada tiene la misma mediana
- Hipótesis alternativa: La muestra dada tiene una mediana diferente.
En este ejemplo, importamos los paquetes, leemos el archivo CSV de iris y usamos la función posthoc_dunn() para realizar la prueba dunns. La prueba de dunn se realiza sobre el ancho del sépalo de las tres especies vegetales.
Haga clic aquí para ver y descargar el archivo CSV.
Python3
# importing packages and modules import pandas as pd import scikit_posthocs as sp # reading CSV file dataset= pd.read_csv('iris.csv') # data which contains sepal width of the three species data = [dataset[dataset['species']=="setosa"]['sepal_width'], dataset[dataset['species']=="versicolor"]['sepal_width'], dataset[dataset['species']=="virginica"]['sepal_width']] # using the posthoc_dunn() function p_values= sp.posthoc_dunn(data, p_adjust = 'holm') print(p_values)
Producción:
- Para la diferencia entre los grupos 1 y 2, el p-valor ajustado es 3.247311e-14
- Para la diferencia entre los grupos 2 y 3, el p-valor ajustado es 1.521219e-02
Verificamos además si los p_values son más altos que el nivel de significación. falso representa que dos grupos son estadísticamente significativos o que se rechaza la hipótesis nula.
Python3
p_values > 0.05
Producción:
En este ejemplo, tomamos el nivel de significancia como 0.05. no hay dos grupos (especies) que sean estadísticamente significativos ya que no hay dos grupos que tengan un valor p superior a 0,05. por lo tanto, podemos decir que la hipótesis nula es falsa y la hipótesis alternativa es verdadera.
Publicación traducida automáticamente
Artículo escrito por sarahjane3102 y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA